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Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen mittels 
qentechnisch veranderter Orqanismen der Gattung Blakeslea. mit dem 
Verfahren heroestellte Carotinoide oder deren Vorstufen und deren Ver- 

wendunq 

Zusammenfassunq 

Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen mittels gen- 
technisch veranderter Organismen der Gattung Blakeslea umfassend 

(i) Transformation mindestens einer der Zellen, 

• (ii) ggf- Homokaryotisierung der 'aus (i) ertialtenen Zellen durch Eliminie- 
rung von Kemen in diesen Zellen, so dass mindestens eirte Zelle mit 
nur einem Kem verbleibt, der die gewtinschte genetische Veranderung 
aus (i) aufweist und zur Auspragung fuhrt, 

(iii) Selektion und Vermehrung der gentechnjsch ver&nderten Zelle oder 
Zelleri, und 

(iv) Isolierung des von den gentechnisch veranderten Zellen produzierten 
Carotinoids oder der von den gentechnischen veranderten Zellen pro- 
duzierten Carotinoidvorstufe. 

nach dem Verfahren hergestellte Carotinoide oder deren Vorstufen und deren 
Verwendung. 
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Verfahren zur Herstelluna von Carotinoideh oder deren Vorstufen mittels 
gentechnisch veranderter Ordanisme n der Gattung Blakeslea. mit dem 
Verfahren heraestellte Carotinoide o der deren Vorstufen und deren Mex- 

wendung 

Die Erfindung betrifft ein Verfahren zur Herstellung von Carotinoiden oder deren 
Vorstufen mittels gentechnisch veranderten Organjsmen der Gattung Blakeslea, 
mit dem Verfahren hergestellte Carotinoide oder deren Vorstufen und deren 
Verwendung. 

Beispielsweise ist es fur die Gewinnung von Phytoen bekannt„ein Gemisch aus 
. Carotinoiden, Vitamin E. und anderen Komponenten, welches auch Phytoen 
enthalt aus Tomaten, Karotten oder Palmol usw. zu extrahieren. Problematisch 
ist hierbei die Trennung der einzelnen Carotinoiden voneinander. So ist bei- 
spielsweise das Phytoen nach diesem Verfahren nicht in reiner Form erhaltlich. 
Auch ist die naturiich vorkommende Menge der Carotinoiden in den Pflanzen 
gering. 

Die Produktion Von Carotinoiden durch verschiedene Microorganismen ist 
ebenfalls bekannt. So ist z. B. in der WO 00/13654 A2 offehbart ein Gemisch 
aus Phytoen und Phytpfluen aus Algen der Art Dunaliella sp. zu extrahieren. 
Auch nach diesem Verfahren ist das Phytoen nicht in reiner Form erhaltlich und 
muss von den anderen Produkten getrennt werdeh. Zudem handelt es sich urn 
gentechnisch unveranderte Algen, deren Biosynthese mittels eines hinzugefOg- 
ten Inhibitors beinflusst werden muss. 

Blakeslea trispora ist als Produktionsorganismus fOr p-Carotin (Ciegler, 1965, 
Adv Appl Microbiol. 7:1) und Lycopin bekannt (EP 1201762, EP 1184464, WO 
03/038064). Die hohen Produktivitaten ftir B-Carotin und Lycopin machen Bla- 
keslea, insbesondere Blakeslea trispora attraktiv fOr die wirtschaftliche fermen- 
tative Herstellung von Carotinoiden und deren Vorstufen: 
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lnsbesondere aufgrund der hohen Produktivitat, die mit Blakeslea in der Pro- 
duktion von Lycopin und p-Carotin erreicht werden, bietet sich dieser Organis- 
mus zur fermentativen Herstellung von Caroflnoiden an. 

5 Es, ist auch von Interesse die Produktivitaten der bisher natOrlicherweise produ- 
zierten Carotine und deren Vorstufen weiter zu steigem und die Herstellung 
weiterer Carotinoide, wie.z. B. Xahthophylle zu ermSglichen, die von Blakeslea 
bisher nicht oder nur in sehr geringem MaBe gebildet und isoliert werden kon- 
nen. 

10 . ' 

Carotinoide werden Futtermitteln, Nahrungsmitteln, Nahningserganzungsmit- 
teln, f Kosmetika und Arzneimitteln zugesetzt. Die Carotinoide dienen vor allem 
als Pigmente zur Farbung. Daneben werden die antjoxidative Wirkung der Ca- 
rotinoide und andere Eigenschaften dieser' Substanzen genutzt. Man unterteilt 
15 die Carotinoide in die reinen Kohlenwasserstoffe, die Carotine und die sauer- 
stoffhaltigen Kohlenwasserstoffe, die Xanthophylle. Xanthophylle wie Canth.a- 
xanthin und Astaxanthin werden beispielsweise zur Pigmentierung von HQhner r 
eiem und Fischen eingesetzt (Britton et al. 1998, Carotinoids, Vol 3, Biosynthe- 
sis and Metabolism}: Die Carotine p-Carotin und Lycopin werden vor allem in 
20 der Humanernahrung eingesetzt. ft-Carotin wird beispielsweise als Getranke- 
farbstoff verwendet. Lycopin hat eine krankheitsvorbeugeride Wirkung (Argwal 
und Rao, 2000, CMAJ 163:739-744; Rao und Argwai 1999, Nutrition Research 
19:305-323). Die farolose Carotinoidvorstufe Phytoen kommt vor allem fur An- 
wendungen als Antioxidans in kosmetischen, pharmazeutischen oder dermato- 
2b logischen Zubereitungen in Frage. 

Der uberwiegende Teil der Carotinoide und deren Vorstufeh, die als Zusatzstof- 
fe fur die oben genannten Anwendungen eingesetzt werden, wird durch chemi- 
sche Synthese hergestellt. Die chemische Synthese ist technisch sehr aufwen- 
30 dig und verursacht hohe Herstellkosten. Fermentative Verfahren sind demge- 
genOber technisch verhaltnismaBig einfach - und basieren auf kostengiinstigen 
Einsatzstoffen. Fermentative Verfahren zur Herstellung von Carotinoiden und 
deren Vorstufen konnen dann wirtschaftlich attraktiv und wettbewerbsfahig zur 
chemischen Synthese sein. wenn die Produktivitat der bisherigen fermentativen 
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Verfahren gesteigert wOrde oder neue Carotinpide auf Basis der bekannten 
Produlctionsorganismen hergestellt werden. kSnnten. . 

Hierzu ist eine gentechnische, d. h. gezielte genetische Veranderung von Bla- 
keslea erforderlich. Insbesondere, wenn Xanthophylle produziert werden sollen, 
da diese Verbindungen natOrlicherweise vom Wildtyp der Blakeslea nicht syn- 
thetisiert werden. 

Z. B. zur Herstellung von Phytoen mittels Fermentation von Blakesles trispora 
sind bisher zwei Methoden bekannt: 

(i) Durch zufellsabhangige > Mutagenese mit chemischen Agenzien wie . 
MNNG kdnnen Mutanten erzeugt werden, in denen Phytoen nicht zu Ly- 
copin und somit' nicht weiter zu IS-Carotin umgesetzt werden kann (Mehta 
und Cerda-Olmedo, 1995, AppL Microbiol. Biotechnol. 42:836-838). 

15 

(ii) Durch Zugabe von Inhibitoren des Enzyms Phytoendesaturase wie 
z.B.' Diphenylamin und Zimtalkohol kann die weitere Umsetzung von 
Phytoen blockiert werden, so dass es sich anreichert (Cerda-Olmedo, 
1989, In: E. Vandamme, ed. Biotechnology of vitamin, growth factorand 

20 pigment production. London: Eisevier Applied Science, S. 27-42). 

Die genannten Methoden zur Herstellung von Phytoen mit Blakeslea trispora 
weisen jedoch eine Reihe von Nachteilen auf . 

25 Die zufallsabhangie Mutagenese betrifft in der Regel nicht nur die Gene der 
Carotinoidbiosynthese zur weiteren Umsetzung von Phytoen, sondern auch 
weitere wichtige Gene, Daher sind Wachstum und Syntheseleistung der Mutan- 
ten oft beeintrachtigt. Die Erzeugung z. B. von PhytoenQberproduzenten durch 
zufallsabhangige Mutagenese von Lycopiniiberproduzenten oder B-Cairotin- 

30 bberproduzenten ist daher entweder nicht oder nur mit groBem experimentellem 
Aufwand zu erreichen. Die Zugabe von inhibitoren verursacht eine Erhohung 
der Produktionskosten und gegebenenfalls eine Verunreinigung des Produktes. 



BASF AG r'-,r-.- / ;,r 4 4. September 2003 

BASF NAE &9&&"'. . '• - r 

•'* 

Daneben kann das Zellwachstum durch den Inhibitor beeintrachtigt werden, so 
dass die Produktion von Carotinoiden oder deren Vorstufen, insbesondere Phy- 
toen eingeschrankt wird. 

Durch eine gentechnische Veranderung kbnnten die oben genannten Nachteile 
der zufallsabhangigen Mutagenese und der Inhibitorzugabe vermieden. werden. 

• '/ 

Allerdings sind bisher keine Methoden zur gentechnischen, d. h. gezielten gen- 
technischen Veranderung von Blakeslea, insbesondere Blakeslea trispora be- 
kannt. 

Als Methode zur Herstellung von gentechnisch veranderten Piizen wurde in ei- 
nigen Fallen die Agrobacterium-vermittelte Transformation erfolgreich einge- 
setzt. So sind z. B. folgende Organismen durch Agrobakterien transformiert 
worden: Saccharomyces cerevisiae (Bundock et al., 1995, EMBO Journal, 
14:3206-3214), Aspergillus awamori, Aspergillus nidularis, Aspergillus niger, 
Colletotrichum gloeosporioides,,Fusarium solani pisi, Neurospora crassa, Tri- 
choderma reesei, Pleurotus ostreatus, Fusarium graminearum (van der Tobrren 
et al., 1997, EP 870835), Agraricus bisporus, Fusarium venenatum (de Grootet 
al., 1998, Nature Biotechnol. 16:839-842), Mycosphaerella graminicola (Zwiers 
et al. 2001, Curr. Genet. 39:388-393), Glarea lozoyensis (Zhang et al., 2003, 
Mol. Gen. Genomics 268:645-655), Mucor miehei (Monfort et ah 2003, FEMS 
Microbiology Lett. 244:101 - 106). 

Von Interesse ist besonders eine homologe Rekombination, bei der zwischen 
der einzufOhrenden DNA und der Zell-DNA mbglichst viele Sequenzhomologien 
bestehen, so dass eine ortsspezifische Einfuhrung bzw. Ausschaltung von ge- 
netischer Information im Genom des Empfangerorganismus' mSglich ist. An- 
dernfalls wird die Spender-DNA durch illegitime bzw. nicht-homologe Rekombi- 
nation ins Genom des Empfangerorganismus integriert, was nicht ortsspezifisch 
erfolgt. 
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Eine durch Agrobacterium vermittelte Transformation und anschlieftende homo- 
loge Rekombination der transferierten DNA wurde bisher be! folgenden Orga- 
nismen naqhgewiesen: Aspergillus awamori (Gouka et al. 1999, Nature Biotech 
5 17:598-601), Glarea lozoyensis (Zhang et al., 2003, Mol. Gen. Genomics 
268:645-655), Mycosphaerella graminicola ((Zwiers et al. 2001, Curr. Genet. 
39:388-393). 

Als weitere Methode zur Transformation von Pilzen ist die Elektroporation be- 
. 10 kannt. Die integrative Transformation von Hefe durch Elektroporation wurde von 
Hill, Nucl. Acids. Res. 17:8011 gezeigt. Fur filamentose Rilze wurde die Trans- 
formation durch Chakaborty und Kapoor beschrieben (1990, Nucl. Acids. Res. 
18:6737). 

15 Eine D biolistische" Methode, d.h. die Obertragung von DNA durch Beschuss von 
Zellen mit DNA-beladenen Partikeln wurde beispielsweise fiir Trichoderma har- 
zianum und Gliocladium virens beschrieben (Lorito et al. 1993, Curr. Genet. 
24:349-356). 

20 Diese Methoden konnten bisher jedoch nicht erfolgreich zur gezielten geneti- 
schen Veranderung von Blakeslea und insbesondere Blakeslea trispora einge- 
setztwerden. , . 

Eine besondere Schwierigkeit bei der Herstellung von gentechnisch verander- 
25 ten Blakeslea. und Blakeslea trispora, ist die Tatsache, dass deren Zellen in al- 
ien Stadien des sexuellen und des vegetativen Zelizyklus mehrkernig sind. In 
Sporen von Blakeslea trispora Stamm NRRL2456 und NRRL2457 wurden z. B. 
im Durchschnitt 4,5 Kerne pro Spore nachgewiesen (Metha und Cerda-Olmedo, 
1995, Appl. Microbiol. Biotechnol. 42:836-838). Dies hat zur Folge, dass die 
30 gentechnische Veranderung in aller Regel nur in einem oder wenigen Kemen 
vorliegt, die Zellen also heterokaryotisch sind. 



BASF AG .... ™, '6'"' 4. September 2003 

BASF NAE 5t9/0? r v « ; ' • 

Sollen die genetisch veranderten Blakeslea, insbesondere Blakeslea trispora 
zur Produktion eingesefzt werden, so ist es insbesondere bei einer Gendeletion 
wichtig, dass in den Produktionsstammen die gentechnische Veranderung in 
alien Kemen vorliegt, so dass eine stabile und hone Syntheseieistung ohrie Ne- 
5 . benprodukte m6giich wird. Die Stamme miissen folglich in Bezug auf die gen- 
technische Veranderung homokaryotisch sein. 

Lediglich fiir Phycomyces blakesleeanus ist ein Verfahren beschrieben worden, 
urn homokaryotische Zelleh zu erzeugen (Roricero et al, 1984, Mutat. Res. 
10 125:195). Durch Zugabe des mutagenen Agens MNNG (N-Methyl-N'-nitro-N- 
nitrosoguanidin) \werden nach dem dort beschriebenen Verfahren Kerne in deri 
Zellen eliminiert, so dass statistisch eine gewisse Anzahl. von Zellen mit nur 
noch einem funktionellem Kern vorliegt. Die Zellen werden dann einer Selektion 
unterzogen, in der nur einkemige Zellen mit einem rezeSsiven Selektionsmarker 
15 zu einem Mycel auswachsen konnen. Die Nachkommen dieser selektierten Zel- 
len sind mehrkemig und homokaryotisch. Ein rezessiver Selektionsmarker fQr 
Phycomyces blakesleanus ist z. B. dar. dar + -Stamme nehmen das toxische Ri- 
boflavin-Analog 5-Carbon-5-deazariboflavin auf; dar'-Stamme dagegen nicht 
(Delbruck et al. 1979, Genetics 92:27). Die Selektion von rezessiven Mutanten 
20 erfolgt durch Zugabe von 5-Carbon-5-deazariboflavin (DARF). 

Allerdings ist dieses Verfahren nicht fur Blakeslea, insbesondere Blakeslea 
trispora bekannt und Insbesondere nicht mit im Zusammenhang mit einer 
"Transformation Oder der Produktion von Carotinoiden oder deren Vorstufen be- 
25 schrieben worden. 

Aufgabe der Erfindung ist es gentechnisch veranderte Zellen von Blakeslea- 
Stammen, insbesondere Blakeslea trispora bereitzustellen, die Carotinoide oder 
deren Vorstufen, insbesondere Phytoen produzieren. Zudem soil das Verfahren 
30 die Steigerung der Carotinoid-Produktivitat der veranderten Zellen gegenuber 
den korrespondierenden Wildtypen erlauben; Ferner soli das Verfahren die Er- 
zeugung neuer Zellen oder aus ihnen bestehendes Mycel erlauben, die sich fQr 
.die Verwendung zur Herstellung von Carotinoiden oder deren Vorstufen eignen, 
die bisher nicht in wirtschaftlich interessanten Mengen aus den naturlich vor- 
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kommenden Pilzen gewinnbar waren, insbesondere Xanthophylle und Phytoen. 
Das Verfahren soil dabei eine gentechnische Veranderung von Blakeslea- 
Stammen, insbesondere Blakeslea tnspora moglich machen und die Herstel- 
lung homok'aryotischer gentechnisch veranderter Produktions-Stamme eriau- 
ben. 

Diese Aufgabe wird durch ein Verfahren zur Hersteliung von Carotinoiden oder 
deren Vorstufen mittels gentechnisch. veranderten Organismen der Gattung 
Blakeslea gelost, umfassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen durch Eliminie- 
rung von Kemen in diesen Zellen, so dass mindestens eine Zelle mit 
nur einem Kern verbleibt, der die gewGnschte genetische Veranderung 
aus (i) aufweist und zur Auspragung fOhrt, 

(iii) Selektion und Vermehrung der gentechnisch veranderten Zelle oder 
Zellen, und 

(iv) Isolierung des von den gentechnisch veranderten Zellen produzierten 
Carotinoids oder der von den gentechnischen veranderten Zellen pro- 
duzierten Carotinoidvorstufe. 

Mit der erfindungsgemalien Methode ist es mSglich, Blakeslea gezielt und stabil 
genetisch zu verandem, ,um so Mycel aus Zellen mit einheitlichen Kemen zu 
gewinnen, das Carotinoide oder deren Vorstufen, insbesondere Phytoen produ- 
• ziert. Vorzugsweise handelt es sich urn Zellen von Pilzen der Art Blakeslea 
trispora. Die produzierten Carotinoiden oder deren Vorstufen sind dabei im we- 
sentlichen frei von Verunreinigungen erhaltlich und es konnen hohe Konzentra- 
tionen der Carotinoiden oder deren Vorstufen im Kulturmedium erzielt werden. 

Unter Transformation wird die Obertragung einer genetischen Information in 
den Organismus, insbesondere Pilz verstanden. Darunter sollen alle dem 
Fachmann bekannten M6glichkeiten zur Einschleusung der Information, insbe- 
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sondere DNA fallen, z. B. Beschuss mit DNA-beladenen Partikeln, TiTansforma- 
tion mittels Protoplasten, Mikroinjektion Von DNA, Elektroporation, Konjugation 
oder Transformation kompetenter Zellen, Chemikalien Oder Agrobakterien ver- 
mittelte Transformation. Als genetische Information werden ein Genabschnitt, 
ein Gen oder mehrere Gene verstanden. Die genetische Infomnation kann z. B. 
mit Hilfe eines Vectors oder als freie Nukleinsaure (z. B. DNA, RNA) uhd auf 
sonstige Weise in die Zellen eingebracht und entweder durch Rekombination 
ins Wirtsgenom eingebaut oder in freier Form in der Zelle voriiegen. Besbnders 
bevorzugt ist hierbei die homologe Rekombination. 

i 

Bevorzugte Transformationsmethode ist die Agrobacterium turriefaciens- 
vermittelte Transformation. Hierzu wird zunachst die zu transferierende Spen- 
derrDNA in einen Vektor eingefOgt, der (i) flankierend zu der zu transferieren- 
den DNA die T-DNA-Enden tragt, der (ii) einen Selektionsmarker enthSIt und 
der (iii) ggf. Promotoren und Terminatoren fQr die Genexpression der Spender- 
DNA aufweist. Dieser Vektor wird in einen Agrobacterium r tumefaciens-Stamm 
iibertrageri, der ein Ti-Plasmid mit den vir-Genen enthalt. vir-Gene sind fur den 
DNA-Transfer in Blakeslea verantwortlich. Mit diesem Zwei-Vektor-System wird 
die DNA von Agrobacterium in Blakeslea iibertragen. Hierzu werden die Agro- 
bakterien zunachst in Gegenwart von Acetosyringone inkubiert Acetosyringone 
induziert die vir-Gene. Anschliellend werden Sporeh von Blakeslea trispora zu- 
sammen mit den induzierten Zellen von Agrobacterium tumefaciens auf Aceto- 
syringone-haltigem Medium inkubiert und dann auf Medium pbertragen, das 
eine Selektion der Transformanten, d.h. dec gentechnisch veranderten Stamme 
von Blakeslea erm6glicht. 

Der Begriff VeGtor wirel in der vorliegenden Anmeldung als eine Bezeichnung fur 
ein DNA-Molekul verwendet, das zum Einschleusen uhd ggf. zur Vermehrung 
von Fremd-DNA in eine Zelle dient (siehe auch "Vector" in Rompp Lexikon 
Chemie - CDROM Version 2.0, Stuttgart/New York: Georg Thieme Verlag 
1999).' In der vorliegenden Anmeldung sollen unter dem begriff "Vector" auch 
Plasmide, Cosmide usw. verstanden werden, die dem gleichen Zweck dienen. 
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Unter Expression wird in der vorliegenden Anmeldung die Obertragung einer 
genetischen Information ausgehend von DNA oder RNA in ein Gen-Produkt 
(hier vorzugsweise Enzyme zur Herstellung von Carotinoiden und insbesondere 
Phytoen) verstanden und soil auch den Begriff der Oberexpression beinhalten, 
womit eine verstarkte Expression gemeint ist, so dass ein bereits in der nicht 
transformierten Zelle (Wildtyp) hergestelltes Genprodukt verstarkt produziert 
wird Oder einen groBen Teil des gesamten Gehaltes der Zelle ausmacht. 

Unterr gentechnische Veranderung solldie Einschleusung genetischer Informa- 
tion in einen Empfangerorganismus, so dass diese stabjl exprimiert und bei der 
Zellteilung weitergegeben wird, verstanden werden. In diesem Zusammenhang 
ist die Homokaryotisierung, die Herstellung von Zellen, die nur einheitliche Ker- 
ne enthalten, d. h. Kerne mit gleichem genetischem Informationsgehalt. 

Diese Homokaryotisierung ist nur notwendig, wenn die durch Transformation 
eingefOhrte genetische Information rezessiv vorliegt, d. h. nicht zur Auspragung 
' gelangt. FOhrt die Transformation aber zu einem dominanten Voriiegen der ge- 
netischen Information, d. h. wird sie ausgepragt, so ist eine Homokaryotisierung 
nicht unbedingt ndtig. Vorzugsweise wird zur Homokaryontisierung ein mutage- 
nes Agens eingesetzt, wbbei es sich insbesondere urn N-Methyl-N'-nitro- 
nitrosoguanidin (MNNG) handelt. 

Unter Selektion wird die Auswahl von Zellen verstanden, deren Keme dieselbe 
genetische Information beinhalten, d. h. Zellen die die gleichen Eigenschaften 
aufweisen, wie Resistenzen oder die Herstellung bzw. vermehrte Herstellung 
eines Produktes. In der Selektion werden bevorzugt 5-Carbon-5-deazariboflavin 
(darf) und Hygromycin (hyg) eingesetzt. 

Der in der Transformation (i) eingesetzte Vector kahn derart gestaltet sein, dass 
die im Vector enthaltene genetische Information in das Genom mindestens ei- 
ner Zelle integriert wird. Dabei kann genetische Information in der Zelle ausge- 
schaltet werden. Dies kann direkt, d. h. durch eine Deletion erfolgen. Es ist aber 
auch moglich, daB der in der Transformation (i) eingesetzte Vector derart 
ausgestaltet ist, dass die im Vector enthaltene genetische Information in* der 
> Zelle exprimiert wird, d. h. genetische Information eingefOgt wird, die im 
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exprimiert wird, d. h. genetische Information eingeftigt wird, die irri korrespon- 
dierenden Wildtyp nicht vorhanden ist oder die durch die Transformation ver- 
starkt bzw. Oberexprimiert wird urid deren Produkt das Gen ausschaltet. Die 
eingefOhrte genetische Information kann aber auch indirekt eihe genetische In- 
formation in derZeile ausschalten, z. B. durch Pnoduktion eines Inhibitors. 

J i 

Der eingesetzte Vector enthSIt genetische Informationen oder Teile der geneti- 
schen Information zur Herstellung von Carotinoiden oder deren Vorstufen, ins- 
besondere Carotineri oder Xanthophyllen oder deren Vorstufen. Der eingesetz- 
te Vector enthSIt vorzugsweise genetische Informationen zur Herstellung von 
Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, {3-Carotin, Andoni- 
xanthin, ■ Adonirubin, Canthaxanthiri, 3-Hydroxyechinenon; 3- 
Hydroxyechinenon, Lycopin, Lutein oder Phytoen. Ganz besonders bevorzugt 
enthSIt der Vector Informationen zur Herstellung von Phytoen, Astaxanthin oder 
Zeaxanthin. 

In einer bevorzugten AusfQhrungsform werden die Organismen der Gattung 
Blakeslea beispielsweise dadurch in die Lage versetzt Xanthophylle, wie bei- 
spielsweise Canthaxanthin, Zeaxanthin oder Astaxanthin herzustellen, indem 'in 
den genetisch verSnderten Organismen der Gattung Blakeslea im Vergleich 
zum Wildtyp eine Hydroxylase-Aktivitat und/oder Ketolase-Aktivitat verursacht 
wird. 

Unter Ketolase-Aktivitat wird die Enzymaktiyitat einer Ketolase verstanden. 

Unter einer Ketolase wird ein Protein verstanden, das die enzymatische Aktivi- 
tat aufweist, am, gegebenehfalls substituierten, ji-lonon-Ring von Carotinoiden 
eine Keto-Gruppe einzufiihren. 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das die enzy- 
matische Aktivitat aufweist, p-Carotin in Canthaxanthin umzuwandeln. 
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Dementsprechend wird unter Ketolase-Aktivitat die in einer bestimmten Zeit 
durch das Protein Ketolase umgesetzte Menge p-Carotin bzw. gebildete Menge 
Canthaxanthin verstanden. 

Unter dem Begriff "Wildtyp" wird erfindungsgemali der entsprechende nicht ge- 
rietisch veranderte Ausgangsorganismus der Gattung Blakesleaa verstanden. 

Je nach Zusammenhang kann unter dem Begriff "Organismus" der Ausgangs- 
organismus (Wildtyp) der Gattung. Blakesleaa oder ein erfindungsgemaBer, ge- 
netisch veranderter Organismus der Gattung Blakesleaa oder beides verstan- 
den werden. 

Vorzugsweise wird unter 'Wildtyp" fur die Verursachung der Ketolase-Aktivitat 
und fur die Verursachung der Hydroxylase-Aktivitat jeweils eine Referenz Orga- 
nismus verstanden. . 

Diese Referenzorganismus der Gattung Blakesleaa ist Blakeslea trispora ATCC 
14271. * 

Die Bestimmung der Ketolase-Aktivitat in erfindungsgemaiien genetisch veran- 
derten Organismen der Gattung Blakesleaa und in Wildtyp- bzw. Referenzorga- 
nismen erfolgt vorzugsweise unter folgenden Bedingungen: 

Die Bestimmung der Ketolase-Aktivitat in Organismen der Gattung Blakeslea 
erfoigt in Anlehnung an die Methode von Frazer et al., (J. Biol. Chem. 272(10): 
6128-6135, 1997). Die Ketolase-Aktivitat in Extrakten wird mit den Substraten 
beta-Carotin und. Canthaxanthin in Gegenwart von Lipid (Sojalecithin) und De- 
tergens (Natriumcholatj bestimmt. Substrat/Produkt-Verhaltnisse aus den Keto- 
lase-Assays werden mittels HPLC ermittelt. 

Der erfindungsgemafie genetisch veranderte Organismus der Gattung Blakes- 
leaa weist in dieser, bevorzugten AusfQhrungsform im Vergleich zum genetisch 
. nicht veranderten Wildtyp eine Ketolase-Aktivitat auf und ist somit vorzugsweise 
in der Lage, transgen eine Ketolase zu exprimieren. 
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In einer weiter bevorzugten AusfQhrungsfbrm erfolgt die Verursachung der 
Ketolase-Aktivitat in • den Organismen der Gattung 3lakesleaa durch 
Verursachung der Genexpressipn einer Nukleinsaure kodierend eine Ketolase. 

5 . " i '■. ■ ■ • ■ . . 

In dieser bevorzugten AusfQhrungsform erfolgt die Verursachung der Genex- 
pression einer Nukleinsaure kodierend eine Ketolase vorzugsweise durch Ein- 
bringen von Nukleinsauren, die Ketolasen kodieren in die Ausgangsorganismus 
der Gattung Blakesleaa. 
10 ' 
Dazu kann prinzipiell jedes Ketolase-Gen, also jede Nukleinsauren die eine 
Ketolase codiert verwendet werden. 

Alle in der Beschreibung erwShnten Nukleinsauren konnen beispielsweise eine 
15 RNA-, DNA- Oder cDNA-Sequenz sein. 

Bei genomischen Ketolase-Sequenzen aus eukarybntischen Quellen, die In- 1 
trons enthalten, sind fur den Fall das der Wirtsorganismus der Gattung Blakes- 
leaa nicht in der Lage ist oder nicht in die Lage versetzt werden kann, die ent- 
20 sprechenden Ketolase zu exprimieren, bevorzugt bereits. prozessierte Nuklein- 
sSuresequenzen, wie die entsprechenden cDNAs zu verwenden. 

Beispiele fur Nukleinsauren, kodierend eine Ketolase und die entsprechenden 
Ketolasen, die im erfindungsgemaBen Verfahren verwendet werden konnen 
25 sind beispielsweise Sequenzen aus: 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis Fiotow em. 
Wille (Accession NO: X86782; Nukleinsaure: SEQ ID NO: 18, Protein SEQ ID 
NO: 19), 

30 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: SEQ 
ID NO: 20, Protein SEQ ID NO: 21), 
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Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ ID 
NO: 22, Protein SEQ ID NO: 23), 

Alicaligenes spec. (Accession NO: D58422; Nukleinsaure: SEQ ID NO: 24, Pror 
tein SEQ ID. NO: 25), 

Paracoccus marcusii (Accession NO: Y151 12; Nukleinsaure: SEQ ID NO: 26, 
Protein SEQ ID NO: 27). 

Synechocystis sp. Strain PC6803 (Accession NO: NP442491; Nukleinsaure: 
SEQ ID NO: 28, Protein SEQ ID NO: 29). 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 30, 
Protein SEQ ID NO: 31). 

Nostoc sp. Strain PCC7 120 (Accession NO: AP003592, BAB74888; Nuklein- 
saure: SEQ ID NO: 32, Protein SEQ ID NO: 33), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. NZ_AABC01000195, 
Basenpaar 55,604 bis 55,392 (SEQ ID NO: 34); Protein: Acc.-No. 
ZP_001 11258 (SEQ ID NO: 35) (als putatives Protein annotiert), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. NZ_AABC01000196, 
Basenpaar 140,571 bis 139,810 (SEQ ID NO: 36), Protein: (SEQ ID NO: 37) 
(nicht annotiert), 

Weitere natilrliche Beispiele f(ir Ketolasen und Ketolase-Gene, die im erfin- 
dungsgemafien Verfahren verwendet werden konnen, lassen sich beispielswei- 
se aus verschiedenen Organismen, deren genomische Sequenz bekannt ist, 
durch Identitatsvergleiche der Aminosauresequenzen oder der entsprechenden 
riickubersetzten Nukleinsauresequenzen aus Datenbanken mit den vorstehend 
beschriebenen Sequenzen und insbesondere mit den Sequenzen SEQ ID NO: 
19 und/oder 33 leicht aufRnden. 
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Weitere natGrliche Beispiele fur Ketolasen und Ketolase-Gene lassen sich wei- 
terhin ausgehend von den vorstehend beschriebenen Nukleinsauresequenzen, 
insbesondere ausgehend von den Sequenzen SEQ ID NO: 19 und/oder 33 aus 
verschiedenen Organismen, deren genomische Sequenz nicht bekannt ist, 
5 durch Hybridisierungstechniken in an sich bekannter Weise leicht auffinden. 

Die Hybridisierung kann unter moderaten (geringe Stringenz) oder vorzugswei- 
se unter stringenten (hohe Stringenz) Bedingungen erfolgen. 

10 Solche Hybridisierungsbedingungen sind beispielsweise bei Sambrook, J., 
Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2. Auf- 

I lage, Cold Spring Karbor Laboratory Press, 1989, Seiten 9.31-9.57 oder in Cur- 
rent Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6 
beschrieben. 

15 . 

Beispielhaft kbnnen die Bedingungen wahrend des Waschschrittes ausgewahlt 
• sein aus dem Bereich von Bedingungen begrenzt von solchen mit geringer 
Stringenz (mit 2X SSC bei 50_C) und solchen mit hoher Stringenz (mit 0.2X 
SSC bei 50_C, bevorzugt bei 65_C) (20X SSC: 0,3 M Natriumcitrat, 3 M Natri- 
20 umchlorid, pH 7.0). , 

Dariiberhinaus kann die Temperatur wahrend des Waschschrittes von modera- 
ten Bedingungen bei Raumtemperatur, 22°C, bis zu stringenten Bedingungen 
bei 65°C angehoben werden. 

25 

Beide Parameter, Salzkonzentration und Temperatur, konnen gleichzeitig vari- 
iert werden, auch kann einer der beiden Parameter konstant gehalten und nur 
der andere variiert werden. Wahrend der Hybridisierung kSnnen auch denatu- 
rierende Agenaen wie zum Beispiel Formamid oder SDS eingesetzt werden. In 
30 Gegenwart von 50% Formamid wild die Hybridisierung bevorzugt bei 42°C 
ausgefOhrt. 
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Einige beispielhafte Bedingungen fur Hybridisierung und Waschschritt sind in- 
folge gegeben: 

(1) Hybndisemngsbedingungen mit zum Beispiel 
5 (i) 4X SSC bei 65°C, Oder 

(ii) 6X SSC bei 45°C, Oder 

(iii) . 6X SSC bei 68°C, 100 mg/ml denaturierter Fischsperma-DNA, oder 

(iv) 6X SSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachssper- 
ma-DNA bei 68°C, Oder 

10 (v) 6XSSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachssper- 
ma-DNA, 50 % Formamid bei 42°C, pder 

(vi) ' 50 % Formamid, 4X SSC bei 42°C, Oder 

(vii) . 50 % (vol/vol) Formamid, 0.1 % Rinderserumalbumin, 0.1 % Ficoll, 0.1 % 
Polyvinylpyrrolidon, 50 mM Natriumphosphatpuffer pH 6.5, 750 mM NaCI, 75 

15 mM Natriumcitrat bei 42?C, Oder 

(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

(ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C (moderate Bedingun- 
gen). 

20 (2) Waschschritte fur jeweiis 10 Minuteh mit zum Beispiel 

(i) 0.015 M NaCI/0.0015 M Natriumcitrat/0.1 % SDS bei 50 9 C, oder 

(ii) . 0.1X SSC bei 65°C, oder 

(iii) 0.1X.SSC, 0.5% SDS bei 68°C, oder 

(iv) 0.1X SSC, 0.5 % SDS, 50 % Fonnamid bei 42°C, oder 
25 (v) 0.2X SSC, 0.1% SDS bei 42°C, oder 

(vj) 2X SSC bei 65°C (moderate Bedingungen). 

In einer bevorzugteh AusfOhrungsform der erfindungsgemalien genetisch ver- 
anderteri Organismen der Gattung Blakeslea bringt man Nukleinsauren ein, die 
30 ein Protein kodieren, enthaltend die Aminosauresequenz SEQ ID NO: 19 oder 
eine von dieser Sequenz durch Substitution, Insertion oder Deletion von Amino- 
sauren abgeleitete Sequenz, die eine Identitat von mindestens 20 %, vorzugs- 
weise mindestens 30%, bevorzugter mindestens 40%, bevorzugter mindestens 
50%, bevorzugter mindestens 60%, bevorzugter mindestens 70%, bevorzugter 
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mindestens 80%, besonders bevorzugt mindestens 90% auf Aminosaureebene 
mit der Sequenz SEQ ID NO: 19 und die enzymatische Eigenschaft einer Keto- 
lase aufweist. 

5 Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die wie vor- 
stehend beschrieben durch Identitatsvergleich der Sequenzen aus anderen Or- 
ganismen gefunden werden kann oder um eine kunstliche Ketolase-Sequenz 
die ausgehend von der Sequenz SEQ ID NO: 19 durch kunstliche Variation, 
beispielsweise durch Substitution, Insertion qder Deletion von Aminosauren 

10 . abgewandelt wurde. 

In einer weiteren, bevorzugten AusfOhrungsform der erfindungsgemalien Ver- 
fahren bringt man Nukleinsauren ein die ein Protein kodie'ren, enthaltend die 
Aminosauresequenz SEQ ID NO: 33 oder eine von dieser Sequenz durch Sub- 
15 stitution, Insertion oder Deletion von Aminosauren abgeleitete Sequenz, 
die eine Identltat von mindestens 20 %, vorzugsweise mindestens 30%; bevor- 
zugter mindestens 40%, bevorzugter mindestens 50%, bevorzugter mindestens 
60%, bevorzugter mindestens 70%, bevorzugter mindestens 80%, besonders 
bevorzugt mindestens 90% auf Aminosaureebene mit der Sequenz SEQ ID NO: 
20 33 und die enzymatische Eigenschaft einer Ketolase aufweist. 

Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die, wie vor- 
stehend beschrieben,. durch Identitatsvergleich der Sequenzen aus anderen 
Organismen gefunden werden kan.n oder um eine kOnstliche Ketolase-Sequenz 
25 die ausgehend von der Sequenz SEQ ID NO: 33 durch kOnstliche Variation, 
beispielsweise durch Substitution, Insertion oder Deletion von Aminosauren 
abgewandelt wurde. 

Unter dem Begriff "Substitution" ist in der Beschreibung der Austausch einer 
30 oder mehrerer Aminosauren durch eine oder mehrere Aminosauren zu verste- 
hen. Bevorzugt werden sog. konservative Austausche durchgefOhrt, bei denen 
die ersetzte Aminosaure eine ahnliche Eigenschaft hat wie die ursprilngliche 
Aminosaure, beispielsweise Austausch von Glu durch Asp, Gin durch Asn, 
Val durch lie, Leu durch He, Ser durch Thr. 
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Deletion ist das Ersetzen einer Aminosaure durch eine direkte Bindung. Bevor- 
zugte Positionen fur Deletionen sind die Termini des Polypeptides und die Ver- 
knupfungen zwischen den einzelnen Proteindomanen. 

Insertionen sind EinfDgungen von Aminosauren in die Polypeptidkette, wobei 
forma) eine direkte Bindung durch ein oder mehrere Aminosauren .ersetzt wird. 

Unter Identitat zwischen zwei Proteinen wird die identitat der Aminosauren uber 
die jeweils gesamte Proteinlange verstanden, insbesondere die Identitat 
die durch Vergleich mit Hilfe der Lasergene Software der Firma DNASTAR, inc. 
Madison, Wisconsin (USA) unter Anwendung der Clustal Methode (Higgins DG, 
Sharp PM. Fast and sensitive multiple, sequence alignments on a microcompu- 
ter. Comput Appl. Biosci. 1989 Apr;5(2): 151-1) unter Einstellung folgender Pa- 
ts rameter berechnet wird: 

' - v. 
Multiple alignment parameter. 

Gap penalty 10 

Gap length penalty 10 

20 Pairwise alignment parameter: 

K-tuple . 1 

Gap penalty 3 

Window 5 

Diagonals saved 5 

25 

Unter einem Protein, das eine Identitat von mindestens 20% auf Aminosaure- 
ebene mit der Sequenz SEQID NO: 19 oder 33 aufweist, 
wird dementsprechend ein Protein verstanden, das bei einem Vergleich seiner 
Sequenz mit der Sequenz SEQ ID NO: 19 oder 33, insbesondere nach obigen 
30 Programmlogarithmus mit obigem Parametersatz eine Identitat von mindestens 
20 % aufweist. 
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Geeignete Nukleinsauresequenzen sind beispielsweise durch RuckObersetzung 
der Polypeptidsequenz gemad dem genetischen Code erhaltiich. 

Bevorzugt werden daftir solche Codons verwendet, die entsprechend der Bla- 
kesleaaspezifischen codon usage haufig verwendet werden. Die codon usage 
lasst sich anhand voii Computerauswertungen anderer, bekannter Gene von 
Organismen der Gattung Blakesleaa ieicht ermitteln. 

In einer besonders bevorzugten Ausfilhrungsform bringt man eine Nukleinsau- 
re, enthaltend die Sequenz SEQ ID NO: 18 in die Organismus der Gattung ein. 

In einer weiteren, besonders bevorzugten Ausfuhrungsform bringt man eine 
Nukleinsaure, enthaltend die Sequenz SEQ ID NO: 32 in die Organismus der 
Gattung ein. 

Alle vorstehend erwahnten Ketolase-Gene sind weiterhin in an sich bekannter 
Weise durch chemische Synthese aus den Nukleotidbausteinen wie beispiels- 
weise durch Fragmentkondensatioh einzelner Qberlappender, kompiementarer 
Nukleinsaurebausteine der Doppelhelix herstellbar. Die chemische Synthese 
von Oligonukleotiden kahn beispielsweise, in bekannter Weise, nach der 
Phosphoamiditmethode (Voet, Vpet, 2. Auflage, Wiley Press New York, S. 896- 
897) erfolgen. Die Anlagerung synthetischer Oligonucleotide und AuffQIIen von 
LOcken mithilfe des Klenow-Fragmentes der. DNA-P6ly'merase und Ligations- 
reaktionen sowie allgemeine Klonierungsverfahren werden in Sambrook et al. 
(1989), Molecular cloning: A laboratory manual, Cold Spring Harbor Laboratory 
Press, beschrieben, 

Unter Hydroxylase-Aktivitat die Enzymaktivitat einer Hydroxylase verstanden. 

Unter einer Hydroxylase wird ein Protein verstanden, das die enzymatische Ak- 
tivitat aufweist, am, gegebenenfalls substituierten, p-lonon-Ring von Carotinoi- 
den eine Hydroxy-Gruppe einzufOhren. 
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Insbesondere* wird unter einer Hydroxylase ein Protein verstanden, das . 
die enzymatische Aktivitat aufweist, p-Carotin in Zeaxanthin oder Cantaxanthin 

in Astaxanthin umzuwandeln. 

* 

5 Dementsprechend wird unter Hydrqxyase-Aktivitat die in einer bestimmten Zeit 
durch das Protein Hydroxylase umgesetzte Menge p-Carotin oder Cantaxanthin 
bzw. gebildete Menge Zeaxanthin oder Astaxanthin verstanden. 

Bei einer erhohten Hydroxylase-Aktivitat gegenQber dem Wildtyp wird somit im 
10 Vergleich zum Wildtyp in einer bestimmten Zeit durch das Protein Hydroxylase 
die umgesetzte Menge p-Carotin. oder Cantaxantin bzw. die gebildete Menge 
Zeaxanthin oder Astaxanthin erhoht. 

Vorzugsweise betragt diese ErhohUng der Hydroxylase-rAktivitat mindestens 
15 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzugt mindestens 50 %, 
weiter bevorzugt mindestens 100 %, bevorzugter mindestens 300 %, noch be- 
vorzugter mindestens 500 %, insbesondere mindestens 600 % der Hydroxyla- 
se~Aktivitat des Wildtyps. 

20 Die Bestimmung der Hydroxylase-Aktivitat in erfindungsgemaflen genetisch 
yeranderten Organismen und in Wildtyp- bzw. ReferenzOrganismen erfolgt vor- 
zugsweise unter folgenden Bedingungen: 

Die Aktivitat der Hydroxylase wird nach Bouvier et al. (Biochim. Biophys. Acta 
25 1391 (1998)^ 320-328) in vitro bestimmt. Es wird zu einer bestimmten Menge an 
Organismenextrakt Ferredoxin, Ferredoxin-NADP Oxidoreductase, Katalase, 
NADPH sowie beta-Carotin mit Mono- und Digalaktosylglyzeriden zugegeben. 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat unter 
30 folgenden Bedingungen nach Bouvier, Keller, d'Harlingue und Camara (Xan- 
thophyll biosynthesis: molecular and functional characterization of carotenoid 
hydroxylases from pepper fruits (Capsicum annuum L; Biochim. Biophys. Acta 
1391 (1998), 320-328): 
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Der in-vitro Assay wird in einem Volumen von 0.250 ml Volumen durchgefuhrt. 
Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7.6), 0.025 mg Ferredoxin von 
Spinat, 0.5 Einheiten Ferredoxin-NADP+ Oxidoreduktase von Spinat, 0.25 mM 
NADPH, 0.010 mg beta-Carotin (in 0.1 mg Tween 80 emulgiert), 0.05 mM einer 

5 Mischung von Mono- und Digalaktosylglyzeriden (1 :t), 1 Einheit Katalyse, 200 
Mono- und Digalaktosylglyzeriden, (1:1), 0.2 mg Rinderserumalbumin und Or- 
ganismenextrakt in unterschiedlichem Volumen. Die Reaktionsmischung wird 2 
Stqnden bei 30C inkubiert. Die Reaktionsprodukte werden mit organischem L6- 
sungsmittel wie Aceton Oder Chioroform/Methanol (2:1) extrahiert und mittels 

10 HPLC bestimmt. 

Besbnders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat unter 
folgenden Bedingungen nach Bouvier, d'Harlingue und Camara (Molecular Ana- 
lysis of carotenoid cyclae inhibition; Arch. Biochem. Biophys. 346(1) (1997) 53- 
15 64): 

Der in-vitro Assay wird in einem Volumen von 250 Dl Volumen durchgefuhrt. 
Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7.6),unterschiedliche Mengen 
an Organismenextrakt, 20 nM Lycopin, 250 Dg an chromoplastidarem Stroma- 

20 protein aus Paprika, 0.2 mM NADP+, 0.2 mM NADPH und 1 mM ATP. 
NADP/NADPH und ATP werden in 10 ml Ethanol mit 1 mg Tween 80 unmittel- 
bar vor der Zugabe zum Inkubationsmedium geldst. Nach einer Reaktionszeit 
von 60 Minuten bei 30C wird die , Reaktion durch Zugabe von Chloro- 
. form/Methanot. (2:1) beendet. Die in Chloroform extrahierten Reaktionsprodukte 

25 werden mittels HPLC analysiert. . 

Ein altemativer Assay mit radioaktivem Substrat ist beschrieben in Fraser und 
Sandmann (Biochem. Biophys. Res. Comm. 185(1) (1992) 9-15). 

30 Die ErhShung der Hydroxylase-Aktivitat kann durch verschiedene Wege erfol- 
gen, beispielsweise durch Ausschalten von hemmenden Regulationsmecha- 
nismen auf Expressions- und Proteinebene oder durch Erhohung der Genex- 
pression von Nukleinsauren kodierend eine Hydroxylase gegenOber dem Wild- 
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Die ErhOhurig.der Genexpression der Nukleinsauren kodierend eine Hydroxyla- 
se gegenOber dem Wildtyp kann ebenfalls durch verschiedene Wege erfolgen, 
5 beispielsweise durch Induzierung des Hydroxylase-Gens durch Aktivatoren o- 
der durch Einbringen von einer oder mehrerer Hydroxylase-Genkopien, also 
durch Einbringen mindestens einer Nukleinsaure kodierend eine Hydroxylase in 
denb Orgahismus der Gattung Blakesleaa. 

10 In einer bevorzugten AusfOhrungsform erfolgt die Erhohung der Genexpression 
einer Nukleinsaure kodierend eine Hydroxylase durch Einbringen von minde- 
stens einer Nukleinsaure kodierend eine Hydroxylase in den Organismus der 
Gattung-Blakesleaa. 

15 Dazu kann prinzipiell jedes Hydroxylase-Gen, also jede Nukleinsaure, die eine 
Hydroxylase und jede Nukleinsaure, die eine ^-Cyclase codiert, verwendet wer- 
den. . 

Bei genomischen Hydroxylase-Sequenzen aus eukaryontischen Quellen, die 
20 Introns enthalten, sind filr den Fall das der WirtsOrganismus nicht in der Lage 
ist oder nicht in die Lage versetzt werden kann, die entsprechende Hydroxylase 
zu exprimieren, bevorzugt bereits prozessierte Nukleinsauresequenzen, wie die 
entsprechenden cDNAs zu venwenden. 

25 Ein Beispiel fOr ein Hydroxylase-Gen ist eine Nukleinsaure, kodierend eine Hy- 
droxylase aus Haematococcus pluvialis, Accession AX038729, WO 0061764); 
(Nukleinsaure: SEQ ID NO: 38, Protein: SEQ ID NO: 39). 

sowie Hydroxylasen der folgenden Accession Nummem: 
30 |emb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1, AF499108_1, 
AF315289_1, AF296158_1, AAG49443.1, NP_194300.1, NP_200070.1, 
AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, AAL80006.1, 
AF162276_1, AA053295.1, AAN85601.1, CRTZ_ERWHE, CRTZ_PANAN, 
BAB79605.1, CRTZALCSP, CRTZ_AGRAU, CAB56060.1, ZP_00094836.1, 
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AAC44852.1, BAC77670.1, NP_745389.1, NP_344225.1, NP_849490.1, 
ZP 1 _00087019.1 > NP_503072 i 1, NP_852012.i, NP_1 15929.1, ZP_00013255.1 

In den erfindungsgemalJen bevorzugten transgenen Organismen der Gattung i 
5 Blakeslea liegt also in dleser bevorzugten Ausfuhrungsform gegenOber dem 
Wildtyp mindestens ein weiteres Hydroxylase-Gen vor. 

In dieser bevorzugten AusfOhrungsform weist die genetisch veranderte Orga- 
nismus beispielsweise mindestens eine exogene Nukleinsaure, kodlerend eine, 
10 Hydroxylase oder mindestens zwei. endogene Nukleins§uren, kodierend eine 
Hydroxylase auf. 

» * • 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter AusfOh- 
rungsform als Hydroxylase-Gene Nukleinsauren, die Proteine kodieren, enthal- 
15 tend die AminosSuresequenz SEQ ID NO: 39 oder eine von dieser Sequenz 
d.urch Substitution, insertion oder Deletion von. Aminosauren abgeleitete Se- 
quenz, die eine Identitat von mindestens 30 %, vorzugsweise mindestens 50 %, 
bevorzugter mindestens 70%, noch bevorzugter mindestens 90 %, am bevor- 
zugtesten mindestens 95 % auf Aminosaureebene mit der Sequenz SEQ. ID. 
20 NO: 39, und die die enzymatische Eigenschaft einer Hydroxylase aufweiseh. 

Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich bei- 
spielsweise aus verschiedenen Organismen, deren genomische Sequenz be- 
kannt ist, wie vorstehend beschrieben, durch Homologievergleiche der Amino- 
25 sSuresequenzen oder der entsprechenden rucktibersetzten Nukleirisaurese- 
quenzen aus Datenbanken mit der SeQ ID. NO: 39 leicht auffinden.. 

Weitere Beispiele fOr Hydroxylasen und Hydroxylase-Gene lasseri sich weiter- 
hin beispielsweise ausgehend vori der Sequenz SEQ ID NO: 38 aus verschie- 
30 denen Organismen deren genomische Sequenz nicht bekannt ist, wie vorste- 
hend beschrieben, dufch Hybridisierungs- und PCR-Techniken in an sich be- 
kannter Weise leicht auffinden. 
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In einer welter besonders bevorzugten Ausf Qhrungsform werden zur ErhShung 
der Hydroxylase-Aktivitat Nukleinsauren In Organismen elngebracht, die Protei- 
he kodieren, eiithaltend die Aminosauresequenz der Hydroxylase der Sequenz 
SEQIDNO:39. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch RQckubersetzung 
der Polypeptidsequenz gemaft dem genetischen Code erhaitlich. 

Bevorzugt werden dafQr solche Codons verwendet, die entsprechend der Orga- 
10 nismenspezifischen codon usage haufig verwendet werden. Die. codon usage 
ISsst sich anhand von Computerauswertungen anderer, biskannter Gene der 
betreffenden Organismen ieicht ermitteln. 

In einer besonders bevorzugten Ausfuhruhgsform bringt man eine Nukleinsau- 
i5 re, enthaltend die Sequenz SEQ. ID. NO: 38 in den Organismus ein. 

> . . • 

■i 

■ 

Alle vorstehend erwahnten Hydroxylase-Gene sind weiterhin in an sich bekann- 
ter Weise durch chemische Synthese aus den Nukleotidbausteinen wie bei- 
spielsweise durch . Fragmentkondensation einzelner Qberlappender, komple- 

20 mentarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die chemische 
Synthese von Oligonukleotiden kanrt beispielsweise, in bekannter Weise, nach 
der Phosphoamiditmethode (Voet, Voet, 2. Auflage, Wiley Press New York, Sei- 
te 896-897) erfolgen. Die Anlagerung synthetischer Oligonukleotide und AuffQI- 
len von LUcken mithllfe des Klenow-Fragmentes der DNA-Polymerase und 

25 Ligationsreaktionen sowle allgemeine Klonierungsverfahren werden in 
Sambrook et al. (1989), Molecular cloning: A laboratory manual, Cold Spring 
Harbor Laboratory Press, beschrieben. 



30 Vorzugsweise wird durch die Transformation das Gen der Phytoendesaturase 
ausgeschaltet. 
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Der in der Transformation (i) eingesetzte Vector enth§lt vorzugsweise deh gpd 
Promotor Und/oder den trpC Terminator. Diese haben sich. zur Transformation 
der Blakeslea besonders bewShrt. 

5 Vorteilhafterweise weist der im Vector eingesetzte gpd Promotor die Sequenz 
SEQ. ID. NO:1 auf. Vorteilhafterweise weist der im Vector eingesetzte trpC 
Terminator die Sequenz SEQ. ID. NO:2 auf; 

Insbesondere werden dabei der gpd Promotor und der trpC Terminator &us 
10 Aspergillus nidulans eingesetzt. 

Insbesondere enthait der in der Transformation (i) eingesetzte Vector ein Resi- 
stenzgen. Bevorzugterweise handelt es sich um ein Hygromycin-Resistenzgen 
(hph), insbesondere das aus E. coii. Dieses Resistenzgen hat sich bei dem 
15 Nachweis der Transformation und Selektion der Zellen als besonders geeignet 
herausgestellt. 

Als Promotor fur hph wird also bevorzugt p-gpdA, der Promotor der Glycerinal- 
dehyd-3-phosphatdehydrogenase aus Aspergillus nidulans genutzt. Als Termi- 
20 nator fQr hph wird bevorzugt t-trpC, der Terminator des Gens trpC, codierend 
fur Anthranilatsynthasekomponenten aus Aspergillus nidulans genutzt. 

Der Vector kann beispielsweise die SEQ. ID. NO: 3 aufweisen. 

25 Die gentechnisch veranderten Organismen konnen zur Produktion von Caroti- 
noiden oder deren Vorstufen, insbesondere Phytoen verwendet werden. Auch 
konnen neue, im Wildtyp nattlrlicherweise nicht vorkommende Carotinoide 
durch Einbringung der entsprechenden genetischen Information von den gezielt 
genetisch veranderten Zellen bzw. dem durch sie gebildeten Mycel eizeugt und 

30 anschiieBend isoliert werden. 

Zur Insertionsmutagenese tragt die transferierte DNA beispielsweise ein Frag- 
ment von carB, das Gen der Phytoendesaturase aus Blakeslea trispora. Die 
' Insertionsmutagenese und Inaktivierung von carB in Blakeslea trispora erfolgen 
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durch homologe Rekombination. Es schlieRt sich eine Selektion auf homokaryo- 
tische Mutanten an, deren earB durch die Insertionsmatagenese inaktivitlert 1st. 
Die selektierten uhd vermehrten gezielt genetisch veranderten Zellen konnen 
daher Phytoen im Gegensatz zum Wildtyp nicht zu Lycopin und B-Carotin urn- 
5 setzen und eriauben folglich die Produktion und Gewinnung von Phytoen. 

Die nach dem erfindungsgemaden Verfahren hergestellten Carotinoiden oder 
deren Vorstufen, insbesondere Phytoen eignen sich besonders zur Herstellung 
von ZusStzen fur Futter-, Nahrungs- und Nahrungserganzungsmittel, kosmeti- 
10 schen, pharmazeutischen oder dermatologischen Zubereitungen. 

Die Erfindung wird nachfolgend an Hand von Beispielen naher ausgefuhrt. 

Beispiele 

15 Molekulargenetische Arbeiten wurden, wenn nicht anders beschrieben, nach 
den Methoden in Current Protocols in Molecular Biology (Ausubel et,al. f 1999, 
John Wiley & Sons) durchgefuhrt. 

Stamme und Wachstumsbedingungen 

20 Der Blakeslea trispora Stamm ATCC 14272 (-) (ein Wildtyp) wurde erhalten von 
der American Type Culture Collection. Die Anzucht von B. trispora erfolgte in 
MEP-Medium (Malzextrakt-Pepton-Medium): 30 g/l Malzextrakt (Difco), 3 g/l 
Pepton (Soytone, Difco), Einstellung pH 5,5, ad 1000 ml mit H 2 0 bei 28 °C. Fur 
feste Medien wurde 20 g/l Agar zugegeben. 

25 

F0r die KJonjerung und Vermehrung von Plasmiden; sowie zur Enzymprodukti- 
on und dem Nachweis der Enzymaktivitat wurde Escherichia coli XL1-Blue (Fa. 
Stratagene) eihgesetzt. Die Anzucht erfolgte in LB-Medium (Luria-Bertani- 
Medium) 10 g/l Trypton, 5 g/l Hefeextrakt, 10 g/l NaCI ad 1000 ml mit H 2 0 bei 
30 28 °C oder bei 37 °C. Den Kulturen wurde nach Bedarf Ampicillin (100 ug/ml), 
Tetracyclin (12 pg/ml), Chloramphenicol (50 ug/ml), 50 pg/ml Kanamycin, 50 pi 
der IPTG-Stammlosung (24 mg/ml H 2 0) pro Agarplatte, 50 pi der X-Gal- 
StammlSsung (20 mg/ml N.N'-pimethylformamid pro Agarplatte, Rhamnose 2% 
(w/v) zugegeben. 
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Die Anzucht von Agrobacterium tumefaciens LBA4404 erfolgte nach Hoekema 
et al. (1983, Nature 303:179-180) bei 28 °C fQr 24 h in Agrobacterien-Minimal 
Medium (AMM): 10 mM K 2 HP0 4 , 10 mM KH 2 P0 4 , 10 mM Glucose, MM-Salze 
(2,5 mM NaCI, 2 mM MgS0 4 , 700 uM CaCI 2 , 9 uM FeS0 4 , 4 mM (NH 4 ) 2 S0 4 ). 

5 . .' 

Plasmide 

Zur Klonierung fur die DNA-Sequenzanalyse wurde der Vektor pPCR-Script 
Amp SK(+) eingesetzt (Fa. Stratagene). 

10 Zur Expression von carB wurde der Vektor pJOE2702 eingesetzt (Biospektrum 
2000, 1:33-36) eingesetzt. Das gebildete Plasmid wurde pBT4 genannt. FQr den 
Nachweis der EnzymaktivitSt des Proteins CarB wurde pBT4 zusammen mit 
pCAR-AE (J. Baa 1990, 172:6704-6712) in Escherichia coli XL-1 Blue kloniert. 
Klone mit pCAR-AE bilden Phytoen. Klone mit pCAR-AE und pBT4 bilden Ly- 
15 copin. ' - 

Fur die Deletion von carB in Blakeslea trispora wurde der Vektor pBinAHygA- 
carB (SEQ. ID. NO:3, Fig. 3) konstruiert. Der Vorlaufer von pBinAHygAcarB ist 
pBinAHyg (SEQ. ID. NO:4, Fig. 2). pBinAHyg wurde folgendermaBen konstru- 

20 iert: 

Aus dem Plasmid pANsCosI (SEQ. iD. NO:5, Fig. 1, Osiewacz, 1994, Curr. 
Genet. 26:87-90) wurde die gpdA-hph Kassette als Bglll/Hindlll Fragment iso- 
liert und in das BamHI/Hindlll geoffnete binare Plasmid pBin19 (Bevan, 1984, 
Nucleic Acids Res. 12:8711-8721) ligiert. Der so erhaltene Vektor wurde als 
25 pBinAHyg bezeichnet und enthalt das E. coli Hygromycin-Resistenzgen (hph) 
unter Kontrolle des gpd Promoters und des trpC Terrminatbrs aus Aspergillus 
nidulans sowie die entsprechenden Bordersequenzeri, die filr den DNA- 
Transfer von Agrobacterium notwendig sind. . 

30 . Preparation von Nukleinsauren 

Genomische DNA von Blakeslea trispora wurde mit dem DNAeasy Plant Maxi 
Kit, der Fa. Qiagen prapariert. DNA fur die Klonierung wurde nach Gelelek- 
trophorese in E-Gel Pre-Cast Agarose Gels (Fa. Invitrogen) durch das GFX 
PCR DNA and Gel Band Purification Kit (Fa. Amersham Biosciences) gereinigt. 
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Die Preparation von DNA-freier RNA erfolgte mlt Hilfe des RNeasy Plant Minikit 
und des RNase-Free DNAse Set,, der Fa. Qiagen. 

Polymerase-Kettenreaktion 

5 Die Polymerase-Kettenreaktionen wurden mit dem GeneAmpPCR System 9600 
(Fa. Perkin Eimer Cetus) durchgefdhrt. Fur die PCR wurden die Enzyme Pfu- 
Polymerase und Herculase (Fa. Stratagene) eingesetzt. Zur Kontrolle der DNA- 
Sequenz wurden PCRrFragmente nach Amplifikation der chromosomalen DNA 
direkt mehrfach sequenziert. 

cDNA-rSynthese und Amplifikation der cDNA-Kopien 

Fur die cDNA-Synthese wurde das Superscript Preamplification System for First 
Strand cDNA Synthesis, der Fa. Gibco BRL verwendet. Zur cDNA-Synthese 
wurden 5 pg Gesamt-RNA aus Blakeslea trispora eingesetzt. Die RNA wurde in 
15 11 Ml RNAse-freiem Wasser aufgenommen und anschjieliend mit 1 pi oligo(dT)- 
Losung vermischt, 10 min. bei 70°C und ( anschlie(iend 1 min. auf Eis inkubiert. 
Es erfolgte die Zugabe von 2 pi 1 0x synthesis buffer, 2 pi 25 mM MgCI 2l 1 pi 10 1 
mM dNTP Mix, 2 pi 0,1 M DTT, 1 pi Superscript H (200 U/pl). Die Reaktionsan- 
satze wurden 10 min. bei Raumtemperatur, 50 min. bei 42 °C und 15 min. bei 
20 72 °C inkubiert, dann auf Eis gestellt, mit 1 pi RNAseH versetzt und 20 min. bei 
37°C inkubiert Von- der erhaltenen cDNA wurde 1 pi in 100 pi PCR-Ansatzen 
eingesetzt. 

DNA-Sequenzierung 

25 Die DNA-Sequenzierung der PCR-Fragmente und der Plasmide erfolgte nach . 
der Methode des cycle sequencing mit dem BigDye® Terminator v3.1 Cycle 
Sequencing Kit, der Fa. Applied Biosystems: 500 ng Plasmid DNA oder 0.1 
pmol PCR-Produkt, 4 ul BDT v3.1, 1 pi DMSO, 1 pi Primer (im Oberschuli je- 
doch mindestens 10pmol), ad 20pl H2O (Endvolumen). Temperaturprofil: 1) 

30 95°C, 40 s, 2) 95°C, 20 s, 3) 50°C, 20 s, 4) 45-60°C, 90 s, 5) 60°C, 5 min; Zyk- 
lenzahi: 1) Ix; 2-4) 35x, 5) 1x. Nach Dye Terminator Abreinigung und Proben- 
vorbereitung erfolgte die Gelelektrophorese im ABI Prism DNA Sequencer 377, 
der Fa. Applied Biosystems. 
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DNA-Sequenzanalyse 

Fur die DNA-Sequenzanalyse wurden die Programme GAP und BESTFIT ein- 
gesetzt. Das Programm GAP fQhrt einen Sequenzvergleich (Alignment) durch, 
urn die maximale Ahnlichkeit zwischen zwei Sequenzen nach der Methode von 
Needleman und Wunsch (J. Mol. Biol. 48:443-453) zu finden. Das Programm 
BESTFIT fQhrt ein optimales Alignment des Segmentes mit der besten Ahnlich- 
keit zwischen zwei Sequenzen. Das Programm BESTFIT nutzt den "local homo- 
logy algorithm" von Smith und Waterman (Advances in Applied Mathematics 
2;482-489). 

x 

Transformation von Agrobacterium tumefaciens 

Das Plasmid pBinAHyg und dessen Abkfimmlinge (z. B. pBinAHygAcarB) wur- 
den in den Agrobakterienstamm LBA 4404 (Hoekema et al., 1983, Nature 
303:179-180) elektroporiert (Mozo and Hooykaas, 1991, Plant Mol. Biol. 
16:917-918). Zur Selektion wurden bei der AgrobakterienanzUcht folgende Anti- 
biotika verwendet: Rifampicin 50 mg/l (Selektion auf das A tumefaciens Chro- 
mosom), Streptomycin 30 mg/l (Selektion auf das Helferplasmid) und Kanamy- 
cin 100 mg/l (Selektion auf den binaren Vektor). 

Transformation von Blakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM auf 
eine OD 6 oo von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES (pH 5,6), 
5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 pM Acetosyringone) ver- 
dunnt urid erheut Qber Nacht in IM bis zu einer OD 6 oo von ca. 0,6 angezogen. 

Zur Co-lnkubation von Blakeslea und Agrobacterium wurden 100 pi Agrobakte- 
riensuspension mit 100 pi Blakeslea Sporensuspension (10 7 Sporen/ml in 0,9% 
NaCI) gemischt und s'teril auf einer Nylon Membran (Hybond N, Amersham) auf 
IM-Agarose Platten (IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 
°C wurde die Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/I Pep- 
ton, pH 5,5, .18 g/l Agar) uberfQhrt. Zur Selektion auf transformierte Blakeslea- 
zellen enthielt das Medium Hygromycin in einer Konzentration von 100 mg/l 
sowie zur Selektion gegen Agrobakterien 100 mg/l Cefotaxim. Die Inkubation 
erfolgte fur ca. 7 Tage bei 26 °C. AnschlieRend erfolgte der Transfer von Mycel 
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auf frische Selektionsplatten. Gebildete Sporen wurden mit 0,9% NaCI abge- 
spOlt und auf CM17-1-Agar (3 g/l Glucose, 200 mg/l L-Asparagin, 50 mg/l 
MgS0 4 x 7H 2 0, 150 mg/l KH 2 P0 4 , 25 pg/l ThiamlnHCI, 100 mg/l Yeast Extract, 
100 mg/l Na-desoxycholat, pH 5,5,18 g/l Agar) ausplattiert. 

, Mutagenese mit MNNG 

Zur Reduzierung der Anzahl von Kernen pro Spore wurde eine Behandlung von 
Sporensuspensionen mit MNNG (N-Methyl-N'-nitro-N-nitrosoguanidin) durchge- 
fOhrt. HierfOr wurde zunachst eine Sporensuspension mit 1 x 10 7 Sporen/ml in 
10 Tris/HCI-Puffer, pH 7,0 hergestellt. Der Sporensuspension wurde MNNG in ei- 
ner Endkonzentratidn von 100 pg/ml zugegeben. Die Zeit der Inkubatiort in 
MNNG wurde so gewahlt, dass die Oberlebensrate der Sporen ca. 5% betrug. 
Nach Inkubation mit MNNG wurden die Sporen dreimal mit 1g/l Span 20 in 50 
mM Phosphatpuffer pH 7,0 gewaschen und plattiert. 

15 ■ 

Selektion homonukleater Zellen 

Die Selektion homonukleater Zellen von Blakeslea trispbra carB" erfplgte ana- 
log zum yersuchsprotokoll fQr Phycomyces blakesleeanus (Roncero et all, 
1984, Mutation Research, 125:195-204), modifiziert durch Wachstum in Ge- 
, 20 genwart von 5-Carbon-5-Deazariboflavin (1 pg/ml) und Hygromycin 100 (pg/ml). 

Klonierung und Sequenzanalyse carB 

(carB = Gen der Phytoendesaturase aus Blakeslea trispora.) 

Aus dem Sequenzvergleich der Peptidsequenzen von Phytoendesaturasen und 
25 dem Vergleich der zugehorigen DNA-Sequenzen von Phycomyces blakesleear 

nus, Cercospora nicotianae, Phaffia rhodozyma und Neurospbra crassa wurden 

die degenerierten Primer MAT182 5'-GCNGARGGNATHTGGTAr3' (SEQ. ID. 

NO:6) und MAT192 S'-TCNGCNAGRAADATRTTRTG-S" (SEQ. ID. NO:7) abge- 

leitet. Die PCR wurde in 100 pi Ansatzen durchgefQhrt. Diese enthielten 200 ng 
30 genomische DNA von Blakeslea trispora ATCC14272, 1 uM MAT182, 1 pM 

MAT192, 100 pM dNTP, 10 pi Pfu-Polymerasepuffer 10x, 2,5 U Pfu- 

Polymerase (Zugabe bei 85 °C), H 2 Q ad 100 pi. 
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Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min (1 Zyklus); 40 °C, 30 
s, 72 °C, 30 s, 95 °C, 30 s (35 Zyklen); 72 °C, 1 0 min (1 Zyklus). 

' ' ' • 

Hiermit wurde ein 358-bp-Fragment erhalten, dessen abgeleitete Peptidse- 
5 quenz Ahnlichkeit zu den Sequenzen der Phytoendesaturasen aufwies. Durch 
die Methods der inverseri PCR (Innis et al. in PCR protocols: a guide to meth- 
ods and applications. i990, S. 219-227) wurden nach dem Prinzip des Chro- 
mosome-Walking die Genregionen stromaufwarts und stromabwarts des 350- 
bp-Fragmentes folgendermalien amplifiziert, kloniert und sequenziert: . 
10 (i) ein 1,1-kbp-Fragment durch PCR mit den Primem MAT219 5'- 
AAGTGACACCGGTTACACGCTTGTCTT-3' (SEQ. ID. NO:8) und MAT 
220 S'-GCTTATCACCATCTGTTACCTCCTTGC-S'.CSEQ. ID. NO:9) er- . 
halten aus 200 ng EcoRI-gespaltener und zirkularisierter genomischer 
DNA von Blakeslea trispora ATCC14272, 0,25 pM MAT219, 0,25 pM 
15 MAT220, 100 pM dNTP, 10 ul Herculase-Polymerasepuffer 10x, 5 U 

Herculase (Zugabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 
10 min (1 Zyklus); 85 °C, 5 min (1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 
°C, 30 s (30. Zyklen); 72 °C, 1Q min (1 Zyklus), 
(ii) ein 2,9-kbp-Fragment durch PCR mit den Primern MAT219 und 
20 MAT220 erhalten aus 200 ng Xbal-gespaltener und zirkularisierter 

genomischer DNA yon Blakeslea trispora ATCC 14272, 0,25 pM 
MAT219, 0,25 pM MAT220, 10b pM . dNTP, 10 pi Herculase- 
Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 
100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 'C, 5 min (1 
25 Zykius); 60 °C, 30 s, 72 °C, 3 min, 95 °C, 30 s (30 Zyklen); 72 °C, 10 

min (1 Zyklus): 

Der klonierte Sequenzabschnitt ist schematisch in Fig. 4 (SEQU. ID. No. 10) 
dargestellt. Die Sequenzierung erfolgte in Strang- und Gegenstrangrichtung mit 
30 den klonierten Fragmenten sowie mit den PCR-Produkten. Die Sequenz des 
klonierten Sequenzabschnitts ist in Fig. 5 (SEQU. ID. No. 1 1) gezeigt. 

Sequenzvergleiche 
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1 Die Nukleotidsequenz von carB und die Peptidsequenz des abgeieiteten Prote- 
ins CarB wurden mit den bekannten Sequenzen verwandter Proteine vergli- 
chen. Zum Sequenzvergleich wurden die Programme GAP und BESTFIT ein- 
gesetzt. 

5 

CarB Identische Aminoacylreste nach GAP 

Programmeinstellungen: 
Gap Weight: 8 
Length Weight: 2 
10 Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Werte fOr die Obereinstimmung der Aminosauren' zu 
CarB aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 72,491 
15 Phaffia rhodozyma: 50,460 

Neurospora crassa: 47,943 , 

Cercospora nicotianae: 47,740 

CarB -Identische Aminoacylreste nach BESTFIT 

20 Programmeinstellungen: 
Gap Weight: 8 
Length Weight: 2 
Average Match: 2.912 
Average Mismatch: -2.003 
25 Dabei wurde folgende Werte f Or die Obereinstimmung der Aminosauren zu 
CarB aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus:73,380 
Phaffia rhodozyma: .53,175 
Neurospora crassa: 51,896 
30 Cercospora nicotianae: 50,791 



carB - Identische Basen nach GAP 

Programmeinstellungen: 
Gap Weight: 50 
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Length Weight: 3 
Average Match: 10.000 
Average Mismatch: 0.000 
Dabei wurde folgende Werte fOr die Obereinstimmung der Basen zu CarB aus 
5 Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 64,853 
Cercospora nicotiariae: 50,143 
Phaffia rhodozyma: 43,179 
Neurospora crassa: 42,130 

0 

carB -Identische Basen nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 50 
Length Weight: . 3 
15 Average Match: 10.000 
Average Mismatch: -9.000 

Dabei wurde folgende Werte fflr die Obereinstimmung der Basen zu CarB aus 
Blakesiea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 68,926 
20 Phaffia rhodozyma: 62,403 
Neurospora crassa: 60,230 
Cercospora nicotianae: 56,884 

Klonierung zur Expression von carB 

25 Zur Klonierung und Expression von carB aus Blakeslea trispora wurden von 
dem oben beschriebenen klonierten Sequenzabschnitt aus Blakeslea trispora in 
sechs Leserastem die mSglichen Proteinsequenzen abgeieitet. Diese Protein- 
sequenzen wurden mit den Sequenzen der Phytoendesaturasen aus Phycomy- 
ces blakesleeanus, Phaffia rhodozyma, Neurospora crassa, Cercospora nico- 

30 tianae verglichen. Auf der Grundlage des Sequenzvergleiches wurden im 
klonierten Sequenzabschnitt def geno'mischen DNA von Blakeslea trispora drei 
Exons identifiziert, die zusammengefQgt eine codierende Region ergeben, de- 
ren abgeleitetes Genprodukt Qber die gesamte Lange 72,7% identische Ami- 
noacylreste mit der Phytoendesaturase CarB aus Phycomyces blakesieeanus 
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aufweist. Dieser Sequenzabschnitt aus drei moglichen Exons und zwei mogli- 
chen Introns wurde daher als Gen carB bezeichnet Zur Oberprufung der vor- 
hergesagten Genstruktur wurde die codierende Sequenz von carB aus Blakes- 
lea trispora durch PCR mit cDNA von Blakeslea trispora als Matrize und mit den 
5 Primern Bol1425 5^GAGAGGGATCCTTAAATGCGAATATCGTTGC-3' (SEQ. 
ID. NO:12) und BOI1426 S'-AGAGAGGGATCCATGTCTGATCAAAAGAAGCA- 
3' (SEQ. ID. NO; 13) erzeugt. Das erhaltene DNA-Fragment Wurde sequenziert. 
Die Lokalisation von Exbns und Introns wurde durch Vergleich der cDNA mit 
der genomischen DNA von carB bestatigt. In Fig. 5 ist die codierende Sequenz 
10 von carB schematisch dargestellt. Zur Expression von carB in Escherichia coli 
wurde zunachst die Ndel-Schnittstelle in carB durch die Methode overlap ex- 
tension PCR entfernt sowie am 5-Ende des Gens eine Ndel-Schnittstelle und 
am 3-Ende eine BamHI-Schhitfstelle eingefOgt. Das erhaltene DNA-Fragment 
wurde mit dem Vektor pJOE2702 ligiert. Das erhaltene Plasmid wurde als pBT4 
15 bezeichnet und zusammen mit pCAR-AE in Escherichia coli XLi-Blue kloniert. 
Die Expression erfolgte durch induktion mit Rhamnose. Der Nachweis der En- 
zymaktivitat erfolgte durch Nachweis der Lycopinsynthese via HPLG. Die Klo- 
nierungsschritte sind im folgenden beschrieben: 
PCR 1.1: 

20 Ca. 0,5 ug cDNA von Blakeslea trispora, 0,25 uM MAT350 5- 
ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3 , (SEQ. ID. NO:14), 

0. 25 pM MAT244 5'- 
GTTCCAATTGGCCACATGAAGAGTAAGACAGGAAACAG-3' (SEQ. ID. 
NO: 15), 100 uM dNTP, 10 pi Pfu-Polymerase-Puffer . (I0x), 2,5 U Pfu- 

25 Polymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100pL. 
Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 °C ,30 
s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30 s, 9. 72 °C 10min 

Zyklen: (1-2.) 1x, (3-5.) 5x, (6-8.) 25x, (9 ; ) 1x 
30 • 
PCR1.2: 

Ca. 0,5 pg cDNA von Blakeslea trispora, . 0,25 pM MAT243 5'-. 
. CCTGTCTTACTCTTCATGTGGCCAATTGGAACCAACAC-3 , (SEQ. ID. 
NO:16), 0,25 pM MAT353 5'- 
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CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3' (SEQ. ID. NO:17), 
100 pM dNTP, 10 ul Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu-Polymerase (Zug- 
abe bei 85 °C, "hot start") und H z O ad 100 pL. 
Temperaturprofil: 

5 1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 °C 30 
s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30s, 9. 72 °C 10min 
Zyklen: (1 -2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

Reinigung der PCR-Fragmente aus PCR 1.1, 1.2 
10 Dazu wurde PCR 2 zur Herstellung der codierenden Sequenz von carB aus 
Blakeslea trispora fur die Klonierung in pJOE2702 durchgefuhrt: 
Ca. 50 ng Produkt aus PCR 1.1 und ca. 50 ng Produkt aus PGR1.2 mit 0,25 |jM 
MAT350 S'-ACTTTATrGGATCCTTAAATGCGAATATCGTrGCTGC-S', 0,25 
pM MAT353 S'-CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-S', 
15 100 pM dNTP, 10 |jL Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu-Polymerase (Zu- 
gabe bei 85 °C, "hot start") und H 2 0 ad 100 pL. ' 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 59 °C 30 s, 4. 72 °C 2 min, 5. 95 °C 30 s, 
6.72°C 10 min 
20 Zyklen: (1-2.) 1x, (3-5.) 22x, (6.) 1x 

: Anschlieliend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1 ,7 kbp), 
eine Ligation in Vektor pPCR-Script-Amp, eine Klonierung in Escherichia coli 
XL1-Blue, Sequenzierung der Insertion, Spaltung mit Ndel und BamHI sowie 
eine Ligation in pJOE2702. Das erhaltene Plasmid wurde.als pBT4 bezeichnet. 

25 

Charakterisierung und Nachweis der Enzymaktivitat von CarB (Phytoen- 
desaturase) 

Das von carB abgeieitete Genprodukt wurde ais CarB bezeichnet. CarB weist 
auf Grundlage der Peptidsequenzanalyse folgende Eigenschaften auf: 
30 Lange: 582 Aminoacylreste 

Mo'lekulare Masse: 66470 

Isoelektrische Purikt: 6,7 

Katalytische Aktivitat: Phytoendesaturase 

Edukt: Phytoen 
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Produkt: . Lycopin 

EC-Nummer: EC 1.14.99- 

. Der Nachweis der Enzymaktivitat erfolgte in vivo. Wenn das Plasrtiid (pCAR- 
AE) in Escherichia coli XL1-Blue ubertragen wird, entsteht der Stamm Esch^ri- 
5 chia coli XL1-Blue (pCAR-AE). Dieser Stamm synthetisiert Phytoen. Wenn zu- 
satzlich das Plasmid pBT4 in Escherichia coli XL1-Blue Qbertragen wird, ent- 
steht der Stamm Escherichi.a coli XL1-Blue (pCAR-AE)(pBT4). Da ausgehend 
von carB eine enzymatisch aktive Phytoendesaturase gebildet wird, produziert 
dieser Stamm Lycopin. 

JO i 

Die Plasmide pCAR-AE und pBT4 wurden daher in Escherichia coli ubertragen. 
Nach Wachstum in Flussigkultur wurden die Carotinoide aus den Zellen extra- 
hiert und charakterisiert (vgl. oben). 

15 Durch HPLC Analyse wurde nachgewiesen, daft der Stamm Escherichia coli 
XL1-Blue (pCAR-AE) Phytoen und der Stamm Escherichia coli XL1-Blue 
(pCAR-AE)(pBT4) Lycopin produziert. CarB weist fplglich die Enzymaktivitat 
einer Phytoendesaturase auf. 

20 Vector pBinAHygAcarB zur Erzeugung von carB" -Mutanten von Blakeslea 
trispora 

Die Amplifikation der codierenden Sequenz von carB mit den Primern MAT350 . 
und MAT353 mittels PCR wurde mit den folgenden Parametern durchgefQhrt: 
50 ng pBT4 mit 0,25 \xU MAT350 S-ACTTTATTGGATCCTTAAAT- 
25 GCGAATATCGTTGCTGC-3', 0,25 pM MAT353 '5 f -CTATTTTAATCATATGT- 
CTGATCAAAAGAAGCATATTG-3 , I 100 pM dNTP, 10 pL Pfu-Polymerase- 
Puffer, 2,5 U Pfu-Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pL 4 
H 2 0 

Temperaturprofil: 

30 1. 95 °C 10 min, 2. 85 °G 5 min, 3. 58 °C 30s, A. 72°C 2 min, 5. 95 °G 30s, 6. 
72°C10min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 
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Anschlie&end erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1 ,7 kbp), 
eine Spaltung mit Hindlll, eine weitere Reinigung des 364-bp-Hindlll-Fragments- 
carB, gefolgt yon etner Spaltung von pBinAHyg mit Hindlll, eine Ligation von 
364-bp-Hlndlll-Fragments-carB in pBinAHyg, eine Transformation des Vektors 
5 in Escherichia coli und eine isolierung des Konstruktes und Bezeichnung ais 
pBinAHygAcarB wie oben beschrieben. Altemativ erfolgte eine partielle Spal- 
tung mit Hindlll und die Klonierung eines grofteren Hindill-Fragmentes aus carB 
in pBinAHyg zur Herstellung von pBinAHygAcarB. 

10 Erzeugung von carB" -Mutanten von Blakeslea trispora 

Zunachst wurde das Plasmid pBinAHygAcarB in den Agrobakterienstamm LBA 
4404 Qbertragen, z. B. durch Elektroporation (vgl. oben). Anschlieliend wurde 
das Plasmid von Agrobacterium tumefaciens LBA 4404 in Blakeslea trispora 
ATCC 14272 und in Blakeslea trispora ATCC 14271 Qbertragen (vgl. oben). Der 
15 erfolgreiche Nachweis des Gentransfers in Blakesleslea trispora erfolgte Ober 
Polymerase-kettenreaktibn nach folgendem Protokbll: 

Ca. 0,5 ug DNA aus Blakeslea trispora ATCC 14272 carB" bzw. ATCC ,14271 
carB' wurden mit 0,25 pM Primer hph forward 5- 
. CGATGTAGGAGGGCGTGGATA-3', 0,25 \iM Primer hph reverse 5'- 
20 GCTTCTGCGGGCGATTTGTGT-3V 100'pM dNTP, 10 pL Herculase- 
Polymerase-Puffer, 2,5, U Herculase-DNA-Polymerase (Zugabe bei 85. °C, "hot 
start") und ad 100 pi H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 min, 
25 6.72°C10min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

Als Negativkontrolle wurde eine Amplifikation des Kanamycinresistenzgens aus 
Agrobacterium versucht. Dazu wurden folgende PCR-Bedingungen verwendet: 
30 Ca. 0,5 pg'DNA aus Blakesiea trispora ATCC 14272 carB" bzw. ATCC 14271 
carB" wurden mit 0,25 pM Primer nptlll forward 5'- 
TGAGAATATCACCGGAATTG-3', 0,25 pM Primer nptlll reverse 5- 
AGCTCGACATACTGTTCTTCC-3', 100 pM dNTP, 10 pL Herculase- 
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Polymerase-Puffer, 2,5 U Herculase-DNA-Polymerase (Zugabe bei 85 °C, "hot. 
start") und ad 100 |jL H 2 0 umgesetzt. 
' Temperaturprofir: 

1. 95 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °0 1 min, 
5 6. 72 °C 10 min- 

Zyklen: (1-2.) 1x, (3-5.) 30x, (6.) 1x 

i 

Isolierung homokaryontischer carB- -Mutanten von Blakeslea trispora 

Durch Transfer des Plasmids pBinAHygAcarB in Blakeslea trispora und homo- 
10 loge Rekdmbinatlon entstanden Insertionsmutanten, die zwei unvollstandige 
Kopien von carB in jeweils einem Kern enthielten. Die betrotfenen Kerne zeig- 
ten folglich den Genotyp carB". Da in Blakeslea jedoch in alien Stadien des ve- 
getativeh und des sexuellen Zellzyklus mehrkernige Zellen yorliegen, wird die 
rezessive Mutation carB" nicht als Phanotyp ausgepragt. Urn die rezessive Mu- 
.15 tation zur Auspragung zur bringen, wurden daher homokaryotische Zellen er- 
' zeugt, die in alien Zellkernen die rezessive Mutation tragen. Zur Herstellung 
homokaryonter Zeilen mit den Genotypen carB", hyg R und dar wurde eine Spo- 
rensuspension der carB" -Stamme mit MNNG nach der obigen Vorschrift be- 
handelt. Die Oberlebensrate nach MNNG-Behandluhg betrug ca. 5%. Anschlie- 
20 Bend wurden die Spbren auf MEP-Agarplatten ausplattiert und neue Sporen 
erzeugt. Diese Sporen wurden analog zur Vorschrift von Roncero et al. auf Me- 
dium mit 5-Carbon-5-deazariboflavin plattiert, das zusatzlich Hygromycin ent- 
hielt. Hierdurch wurden homokaryotische Zellen des Genotyps carB", hyg R und 
dar selektiert. Nach diesem Prinzip wurden sowohl (+) als auch (-) Stamme von 
25 Blakeslea trispora mit dem Phanotyp carB-, hyg R und dar erzeugt. Diese 
Stamme sind resistent gegen S-Carbon-S-deazariboflavin, Hygromycin und pro- 
duzieren Phytoen. 

Phytoenproduktion niit den carB"-Mutanten von Blakeslea trispora 

30. Zur Produktion von Phytoen wurden die homokaryonten Blakeslea trispora (+) 
und (-) Stamme des Genotyps carB", hy.g R und dar wie oben angegeben (S. 
11) fermentiert, das produzierte Phytoen mittels HPLC Analyse nachgewiesen 
und isoliert. 
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Das FIQssigmedium zur Produktion von Phytoen enthielt pro Liter: 19 g Mais- 
mehl, 44 g Sojamehl, 0,55 g KH 2 P0 4 , 0,002 g Thiaminhydochlorid, 10 % Son- 
nenblumenSJ. Der pH wurde mit KOH auf 7,5 eingestellt. 

5 Zur Herstellung von Phytoen wurden. ScJiOttelkolben mit Sporensuspensionen 
von (+) und (-) Stammen von Biakeslea trispora carB" beimpft. Die SchOttelkol- 
ben wurden bei 26 °C mit 250 rpm fOr 7 Tage inkubiert Altemativ wurde zu Mi- 
schungen der Stamme nach 4 Tagen TrisporsSuren zugegeben und weitere 3 
Tage inkubiert. Die Endkonzentration der Trisporsauren betrug 300 - 400 |jg/mL 

10 

Trisporsauren sind Sexualhormone in Mucorales Pilzen, wie Biakeslea, wejche 
die Bildung von Zygophoren und die Produktion von jJ-Carotin stimulieren (van 
den Ende 1968, J. Bacteriol. 96:1298 - 1303, Austin et al. 1969, Nature 
223:1178 - 1179, Reschke Tetrahedron Lett. 29:3435 - 3439, van den Ende 
15 1970, J. Bacteriol. 101:423-428). ' 

Extraktion und Analytik 
Extraktion: 

1. Entnahme von 10 ml Kultursuspension 
20 2. Zentrifugation, 10 min, 5.000 xg 

3. Verwerfen des Oberstandes 

4. Resuspendierung des Pellets in 1 ml Tetrahydrdfuran (THF) durch Vorte- 
xen 

5. Zentrifugation, 5 min, 5.000 xg , 
25 6. Abnahme der THF-Phase 

7. Wiederholung der Schritte 4.-6. (2 x) 

8. Vereinigung der THF-Phasen 

\ 9. . Zentrifugation der vereinigten THF-Phasen 5 min bei 20.000 x g, um Re- 
ste der waiirigen Phase abzutrennen 

30 

Analytik 

Messung von Phytoen mittels HPLC 

Saule: ZORBAX Eclipse XDB-C8, 5 um, 150*4,6 mm 

• Temperatun 40 °C 
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Flu&rate: 0,5 ml/min 

injektionsvolumen:10 pi 
Detektion: 
Stoppzeit: 
Nachlaufzeit: 
Maximaldruck: 
Eluent A: 
Eiuent B: 
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UV 220 nm 
12 min 
0 min 
350 bar 

50 mM NaH 2 P0 4 , pH 2,5 mit Perchlorsaure 
Acetonitril 



Gradient: 



Ze'rt [min] A [%] 
0 50 
12 50 



B 

50 

50 



FlufJ [ml/min] 

0,5 

0,5 



Als Matrix wurden Extrakte der Fermentationsbruhen verwendet. Vor der HPLC 
wurde jede Probe wird diirch ein 0,22 pm Filter fiitriert. Die Proben wurden kuhl 
gehalten und vor Licht geschOtzt. Zur Kalibrierung wurden jeweils 50 - 1000 
mg/l eingewogen und in THF gekist. Als Standard wurde Phytoen verwendet, 
welches unter den gegebenen Bedingungen eine Retentionszeit von 7,7 min. 
aufweist. 



. Messung von Lycopin mittels HPLC 

Saule: Nucleosij 100-7 C18, 250*4,0 mm (Macherey & Nagel) 

Temperatur: 25 °C 
Flulirate: 1,3 ml/min 

lnjektionsvolumen:10 pi 



Detektion: 
Stoppzeit: 
Nachlaufzeit: 
Maximaldruck: 
Eluent A: 
Eluent B: 
Gradient: 

Zeit [min] 
0 



450 nm 
15min 
2 min 
250 bar 

10% Aceton, 90% H 2 0 
Aceton 



A [%] 
30 



B[%] F|uli [ml/min] 
70 1,3 
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10 5 95 1;3 

12 5 95 1,3 

13 30 70 1,3 

Als Matrix wurden Extrakte der Fermentationsbriiheh verwendet. Vor der HPLC 
wurde jede Probe wird durch ein 0,22 uni Filter filtriert. Die Proben wurden kiihl 
gehalten und vor Licht geschutzt. Zur Kalibrierung wunden jeweils 10 mg einge- 
wogen und in 100 ml THF geldst. Als Standard wurde Lycopin verwendet, wel- 
ches unter den gegebenen Bedingungen eine Retentionszeit yon 12,3 min. 
aufwelst. 
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Patentanspruche 

1. Verfahren zur Herstellung von Carotlnoiden oder deren Vorstufen mittels 
gentechnisch veranderter Organismen der Gattiing Blakeslea umfassend 

5 (i) Transformation mindestens einer der Zellen, 

(ii) ggf, Homokaryotisierung der aus (i) erhaltenen Zellen durch Eliminle- 
rung von Kernen In diesen Zellen, so dass mindestens eine Zelle mit 
nur einem Kern verbleibt, der die gewGnschte genetische VerSnderung 
aus (i) aufweist und zur Auspragung fOhrt, 

o (iii) Selektion und Vermehrung der gentechnisch veranderten Zelle oder 
Zellen,. und 

(iv) Isolierung des von den gentechnisch veranderten Zellen produzierten 
Carotinoids oder der von den gentechnischen veranderten Zellen pro- 
duzierten Carotlnoidvorstufe. 

15 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich urn 
Zellen von Piizen der Art Blakeslea trispora handelt. 

3. Verfahren nach Anspruch 1 Oder 2, dadurch gekennzeichnet, dass in der 
Transformation (i) ein Vector oder freie Nukleinsauren verwendet werden. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in der 
20 Transformation (i) eingesetzte Vector in das Genom mindestens einer der 

Zellen integrlert wird. 

5. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector derail gestaltet ist, dass die im 
Vector enthaltene genetische Information in der Zelle ausgeschaltet wird. 

25 6. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector derart gestaltet ist, dass die im 
Vector enthaltene genetische Information in die Zelle eingefuhrt wird. 
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7. Verfahren nach einem der vorhergehenden AnsprQche 3 bis 6, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector. ei- 

... nen Promotor und/oder einen Terminator enthait. 

8. Verfahren nach einem der vorhergehenden AnsprQche 3 bis 7, dadurch 
5 gekennzeichnet, dass in der Transformation (i) ein Vector enthaltend den 

gpd Promotor und/oder den trpC Terminatpr eingesetzt vwrd. 

9. Verfahren nach einem der vorhergehenden AnsprQche 3 bis 8, dadurch 
gekennzeichnet, dass in der Transformation (i) ein Vector enthaltend ein 
Resistenzgen eingesetzt wird. 

0 : 10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass der in der 
Transformation (i) eingesetzte Vector ein Hygromycin-Resistenzgen (hph), 
insbesondere aus E. ooli enthaJt. 

11. Verfahren nach einem der vorhergehenden AnsprQche 7 - 10, dadurch ge- 
kennzeichnet, dass der gpd Promoter die Sequenz SEQ. ID. NO:1auf- 
15 weist. 

12:,Verfahren nach einem der vorhergehenden AnsprQche 7-11, dadurch ge- 
kennzeichnet, dass der trpC Terminator die Sequenz SEQ. ID. NO:2 auf- 
weist. . \ • ' . , 

13. Verfahren nach einem der AnsprQche 8 bis 12, dadurch gekennzeichnet, 
20 dass der gpd Promotor und der trpC Terminator aus Aspergillus nidulans 

stahnmen. 

14. Verfahren nach einem der vorhergehenden AnsprQche, dadurch gekenn- 
zeichnet, dass die Transformation (i) mittels Agrobakterien, Konjugation, 
Chemikalien, Elektroporation, Beschuss mit DNA-beladenen Partikeln, Pro- 

25 toplasten oder Mikroinjektion durchgefQhrt wird. 

15. Verfahren nach einem der vorhergehenden AnsprQche, dadurch gekenn- 
zeichnet, dass in der Homokaryotisierung (ii) ein mutagenes Agens einge- 
setzt wird. 
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16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass als mutage- 
nes Agens N-Methyl-N'-nitro-nitrosoguanidin (MNNG) eingesetzt wird. 

17. Verfahren nach einem der yorhergehenden AnsprOche, dadurch gekenn- 
zeichnet, dass in der Selektion (iii) 5-Carbon-5-deazariboflavin (darf) und 
Hygromycin (hyg) eingesetzt werden. 

18. Verfahren nach einem der AnsprOche 3 bis 17, dadurch gekennzeichnet, 
dass der in der Transformation (i) eingesetzte Vector genetische Informatio- 
nen zur Herstellung von Carotinoiden oder deren Vorstufen .enthalt. 

19. Verfahren nach einem der AnsprOche 3 bis 18, dadurch gekennzeichnet, 
dass der in der Transformation (i) eingesetzte Vector genetische informatio- 
nen zur Herstellung von Carotinen oder Xanthophyllen enthalt. 

20 Verfahren nach einem der AnsprOche 3 bis 19, dadurch gekennzeichnet, 
dass der in der Transformation (i) eingesetzte Vector genetische Iriformatio- 
nen zur Herstellung von Astaxanlhin, Zeaxanthin, Echihenon, p- 
Cryptoxanthin, Andonixanthin, Adonirubin, Canthaxanthin, 3-Hydroxy- 
echinenon, 3'-Hydroxyechinenon, Lycopin, p-Carotin, Lutein oder Phytoen 
enthalt. * - 

21.Verfahren nach einem der AnsprOche 3 bis 20, dadurch gekennzeichnet, 
dass durch die Transformation (i) das Gen der Phytoendesaturase ausge- 
schaltet wird. 

i 

22:Verfahren nach einem AnsprOche 3 bis 21, dadurch gekennzeichnet, dass 
der Vector die SEQ. ID. NO:3 umfasst. 

23. Carotinoiden oder deren Vorstufen, insbesondere Phytoen erhaltlich nach 
einem der vorhergehenden AnsprOche. 

24. Verwendung von Carotinoiden oder deren Vorstufen, insbesondere Phytoen 
nach Anspruch 23 zur Herstellung von kosmetischen, pharmazeutischen 
oder dermatologischen Zubereitungen. 
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25. Promotor mit der Sequeriz SEQ. ID*. NO:1 zur Verwendung in dem Verfah- 

i 

ren nach einem der AnsprOche 1 - 22i 

26. Terminator mit.der Sequenz SEQ. ID. NO:2 zur Verwendung in dem Verfah- 
ren nach einem der AnsprQche 1 - 22. . 

27. Vector mit der SEQ. ID. NO:3 zur Verwendung in dem Verfahren nach ei- 
nem der AnsprOche 1 - 22. 
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Fig. 1: Vektor pANsCosI 



A Wl! (11596) 



Afoul (10792) 



flsOa (9739) 
Xtel(94Q9) 



, BsiXl (8657) 
Af0fl(6295) 
flflwHl (62B9) 
AM (8245) 
Awl (7615) 



trpC term (19-792 bp) 

D«riH(1261)' 




hph (814-1833 bp) 
AfcfeI(13S7) . 
Awl tl 477) 
DralD (1554) 
-S?/I(21B7) 
Wfl(2413) 
S&cl (2719) 
\^&ci (2882) 



S»W?I(4996) 



gpdA promoter (1834-3993 bp) 
AM (3055) 
X2tol(3437) 



Fig. 2: Vektor pBinAHyg 



. Srost (15737) 
Kpift (15735) 
£c6RJ(15719) f 
T-DNA left border (14989-15136 bp), 
Bgtt (14553) 
Afoul (14597) 
A&fel (13228). 



nptm (11 222-1 201 6 bp) 



BstW (1.1 038) 




>C»oi(557) 1 
/lsp7DQ(570) 

XAol (939), 

gpdA promoter (4-2163 bp> 
Vtaril(1581) 

SdA(1607) 
\\ EccRl (2402) 
\wctel(2609) 

hph (21 64-31 83 bp) 



trpC terminator C3205-397B bp) 



Wofl (9039) 



4*p700(428B) 
>pfit(5048) 



T-DNA right border (6429-6590 bp) 
Bgto (6599) 
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Fig. 3: Vector pBinAHygAcarB 
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Fig. 4: carB 
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Fig. 5: CDS. von carB 
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sequenzprotokoll 

<110> BASF. AG , 

<120> Verfahren zur Herstellung von Carotinoiden oder deren 
Vorstuf en mittels gentechnisch veranderten Organismen 
•der Gattijng Blakeslea, mit dem Verfajtiren hergestellte 
Carotinoide oder. deren Vorstuf en und deren Verwendiong 

<130> BlASF NAE 579/03 



<140> 
<141> 





60> 39 . 



<170> Patentln Ver. 2.1 

<210> 1 
<211> 2160 
<212> DNA 

<213> Kiinstliche Sequenz 

<220> ' l < 
<223> Beschreibung der Jciinstliclien Sequenz : Promoter 

00> 1 

ttcgacac tgaaatacgt cgagcctgct ccgcttggaa gcggcgagga gcctcgtcct 60 
gtcacaacta ccaacatgga gtacgataag ggccagttcc gccagctcat taagagccag 120 
ttcatgggcg ttggcatgat ggccgtcatg catctgtact tcaagtacac caacgctctt 180 
ctgatccagt cgatcatccg atgaaggege tttcgaatct ggttaagatc cacgtcttcg' 240 
ggaagecage gactggtgac ctccagpgtc cctttaaggc tgccaacagc tttctcagcc 300 
agggccagcc caagaccgac aaggcctccc tccagaacgc cgagaagaac tggaggggtg 360 
gtgtcaagga ggagtaagct ccttat.tgaa .gteggaggae ggagcggtgt caagaggata 420 
ttcttcgact ctgtattata gataagatga tgaggaattg gaggtagcat agcttcattt 480 
ggatttgett tccaggctga gactctagct tggagcatag agggtccttt ggctttcaat 540 
attctcaagt atctcgagtt tgaacttatt ccctgtgaac cttttattca ccaatgagca 600 
ttggaatgaa catgaatctg aggactgeaa tegecatgag gttttcgaaa tacatcegga 660 
tgtcgaaggc ttggggcacc tgcgttggtt gaatttagaa cgtggcacta ttgatcatcc 720 
gatagctctg caaagggegt tgcacaatgc aagtcaaacg ttgctagcag ttccaggtgg 780 
aatgttatga tgagcattgt attaaatcag gagatatagc atgatctcta gttagctcac 840 



BASF AG 
BASF NAE 579/03 

cacaaaagtc agacggcgta accaaaagtc acacaacaca agctgtaagg atttcggcac 900 
ggctacggaa gacggagaag ccaccttcag tggactcgag taccatttaa. ttctatttgt 960 
gtttgatcga gacctaatac agcccctaca acgaccatca aagtcgtata gctaccagtg 1020 
aggaagtgga ctcaaatcga cttcagcaac atctcctgga taaactttaa gcctaaacta 1080 
tacagaataa. gataggtgga gagcttatac cgagctccca a^tctgtcca gatcatggtt 1140 
gaccggtgcc tggatcttcc tatagaatca tccttattcg ttgacctagc tgattctgga 1200 
gtgacccaga gggtcafcgac ttgagcctaa aatccgccgc ctccaccatt tgtagaaaaa 1260 
tgtgacgaac tcgtgagctc tgtacagtga ccggtgactc tttctggcat gcggagagac 1320 
ggacggacgc agagagaagg gctgagtaat aagccactgg ccagacagct ctggcggctc 1380 
tgaggtgcag tggatgatta ttaatccggg accggccgcc cctccgcccc gaagtggaaa 1440 
ggctggtgtg cccctcgttg accaagaatc tattgcatca tcggagaata tggagcttca 1500 
tcgaatcacc ggcagfcaagc gaaggagaat gtgaagccag gggtgtatag ccgtcggcga 1560 
aatagcatgc catfcaaccta- ggtacagaag tccaattgct tccgatctgg taaaagattc 1620 
(•■gagatagt accttctccg aagtaggtag agcgagtacc cggcgcgtaa gctccctaat 1680 
Kgcccatcc ggcatcfegta gggcgtccaa atatcgtgcc tctcctgctt tgcccggtgt 1740 
atgaaaccgg aaaggccgct caggagctgg ccagcggcgc agaccgggaa cacaagctgg 1800 
cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860 
agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920 
ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc ttttctcttt 1980 
cttttcccat cttcagtata ttcatcttcc catccaagaa cctttatttc ccctaagtaa 2040 
gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 2100 
cgagctttcc cacttcatcg cagcttgact aacagptacc ccgcttgagc agacatcacc 2160 

<210> 2 

<211> 774 

•12> DNA ■ ' ' 

13> Kiinstliche Sequenz 

- <220> 

<223> Beschreibung der Idinstlichen Sequenz : Terminator 
<400> 2 

cgatccactt aacgttactg aaatcahcaa acagcttgac gaiatctggat ataagatcgt 60 

tggtgtcgat gtcagctccg gagttgagac aaatggtgtt caggatctcg ataagatacg 120 

ttcatttgtc caagcagcaa agagtgcctt ctagtgattt aatagctcca tgtcaacaag 180 

aataaaacgc gttttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg 240 

cattgactgc aacctagtaa cgccttncag gctccggcga agagaagaat agcttagcag 300 

agctattttc attttcggga gacgagatca agcagatcaa cggtcgtcaa gagacctacg 360 

agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa ttgtactttg 420 

acatgctcct cttctttact ctgatagctt gactatgaaa attccgtcac cagcncctgg 480 
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gttcgcaaag ataattgcat gtttcttcct tgaactctca agcctacagg acacacattc 540 
atcgtaggta taaacctcga aatcanttcc tactaagatg gtatacaata gtaaccatgc 600 
atggttgcct agtgaatgct ccgtaacacc caatacgccg gccgaaactt ttttacaact 660 
ctcctatgag tcgtttaccc agaatgcaca ggtacacttg tttagaggta atccttcttt 720 
ctagctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctcqac tcga 774 

<210> 3 
<211>' 16103 
•<212> DNA 

<213>* Kiinstliche Sequenz 

3> Beschreibiing der kxinst lichen Seqiaenz : Vector 
<^00> 3 ' 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 
cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 
cagttcatgg gcgtrtggcat gatggccgtc atgcatctgt acttcaagta caccaacgct, 180- 
cttctgatcc agtcgatcat ccgctgaagg cigctttcgaa tctggttaag atccacgtct 240 
tcgggaagcc agcgactggt 'gacctccagc gtccctttaa ggctgccaac agctttctca 300 
gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 
gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 
atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 
tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 
aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

•attggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcic 660 
atgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 
. tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
tggaatgtfca tgatgag'cat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 
tgtgtttgat cgagacctaa tacagcccct acaacgacca- tcaaagtcgt atagctacca 1020 
gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 
ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg" 1140 
gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 
ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 
aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 
gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 
ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 
aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 




^rtc 
^^at 
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tcatcgaatc accggcagta agcgaaggag aatgtga&gc caggggtgta tagccgtcgg 1560 
cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc fcggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttfcctgc tctccccacc agctgctctt ttcttt.tctc i980 
tttcttttcc. catcttcagt .atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt ■ gaacctttca 2100 
gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 
£ctccgacc tgatgcagct . ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 
gggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 
.tgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
gaattbagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt . cacgttgcaa 2460 
gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 
atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 
ggtcaataca ctacatggcg tgatttcata tgcgcgattg. ctgatcccca tgtgtatcac 2640. 
tggcaaactg tgafcggacga caccgtcagt . gcgtccgtcg cgcaggctct cgatgagctg 2700 
atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 
aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 
ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 
atggagcagc agacgcgcta pttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 
ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggjbtgacggc 3000 
aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc* 3'060 
gactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
agaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagp tccggagttg agacaaatgg 3300 
tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg cctfcctagtg 33 60 
atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 
gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 
tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 
atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 
gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 
gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 
gccggccgaa. acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 
cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 
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ctccacatct ccactcgacc tgcaggcatg caagcttgag tctatcgcct ccaaaaagta 4020 
cggtgctgaa ttcagratatc aatcgcctgt tgctaaaatt aacactgtcg - ataaagacaa 4080 
gcgtgtaacc ggtgtcactt tggaaagcgg agaagtcatt gaagccgatg cagtcgtatg 4140 
taatgcggat cttgtttatg cttatcacca tctgttacct ccttgcaatt ggacaaagaa 4200 
gacattagcc tcaaagaaac tcacttcatc atctatttcg- ttttattggt ccatgtcaac 4260 
aaaggtgcct caattagacg tacacaatat cttcttggct gaagcctaca aggaaagttt 4320 
tgatgagatt ttcaacgact tcggtttgcq ctctgaagct tggcgtaatc atggtcatag 4380 
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4440 
ataaagtgta aagcctgggg tgcctaafcga gtgagctaac tcacattaat tgcgttgcgc 4500 
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4560 
cgcgcgggga gaggcggttt gcgtatfcggg ccaaagacaa aagggcgaca ttcaaccgat 4620 
tgagggaggg aaggtaaata ttgacggaaa ttattcatta aaggtgaatt atcaccgtca 4680 
ggacttgag ccatttggga attagagcca gcaaaatcac cagtagcacc afctaccatfca 4740 
aggccgg aaacgtcacc aatgaaacca tcgatagcag caccgfcaatc agtagcgaca 4800 
aatgaagtt tgcctttagc gtcagactgt agcgcgtttt catcggcatt ttcggtcata 4860 
gcccccttat tagcgtttgc catcttttca taatcaaaat caccggaacc agagccacca 4920 
ccggaaccgc ctccctcaga gdcgccaccc tcagaaccgc caccctcaga gccaccaccc 4980 
tcagagccgc caccagaacc accaccagag ccgccgccag cattgacagg aggcccgatc 5040 
tagtaacata gatgacaccg cgcgcgataa tttatcctag ttt'gcgcgct atattttgtt 5100 
ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa 5160 
-taacgtcatg cattacatgt taattatfcac atgcttaacg taattcaaca gaaattatat 5220 
gataatcatc ggaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt 5280 
tgaacgatcg gggatcatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag 5340 
caagatatcg cggtgcatct cggtctfcgcc tgggcagtcg ccgccgacgc cgttgatgtg 5400 
gacgccgggc ccgatcatat tgtcgctcag .gatcgtggcg ttgtgcttgt cggccgttgc 5460 
tgtcgtaatg atatcggcac cttcgaccgc ctgttccgca gagatcccgt gggcgaagaa 5520 
ccagcatg agatccccgc gctggaggat ceitccagccg gcgtcccgga aaacgattcc 5580 
gcccaac ctttcataga aggcggcggt ggaatcgaaa tctcgtgatg; gcaggttggg 5640 
cgtcgcttgg tcggtcattt cgaaccccag agtcccgctc agaagaactc gtcaagaagg 57 00 
cgatagaa^g cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg 5760 
tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccaacgc tatgtcctga 5820 
tagcggtccg ccacacccag ccggccacag tcg&tgaatc cagaaaagcg gccattttcc 5880 
accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcatc gccgtcgggc 5940 
atgcgcgcct tgagcctggc gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc 6000 
•agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt 6060 
ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca 6120 
tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc 6180 
ggcacttcgc ccaatagcag 'ccagtccctt cccgcttcag tgacaacgtc gagcacagct 6240 
gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca 63 00 
ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 63 60 
cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 6420 
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ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat * catgcgaaac 6480 
gatccagatc cggtgcagat tatt;tggatt gagagtgaat atgagactct aattggatac 6540 
cgaggggaat ttatggaacg tcagtggagc atttttgaca agaaatattt gctagctgat 6600 
agtgacctta ggcgactttt gaacgcgcaa taatggtttc tgacgtatgt gcttagctca 6660 
ttaaactcca gaaacccgcg gctgagtggc tccttcaacg ttgcggttct gtcagttcca 6720 
aacgtaaaac ggcttgtpcc gcgtcatcgg cgggggtcat aacgtgactc ccttaattct 6780 
ccgctcatga tcagattgtc gtttcccgcc ttcagtttaa actatcagtg tttgacagga 6840 
tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa 6900 
gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 6960 
cagatctggc gccggccagc gagacgagca agattggccg ccgcccgaaa cgatccgaca 702Q 
gcgcgcccag cacaggtgcg caggcaaatt gcaccaacgc atacagcgcc agcagaatgc 7080 
catagtgggc ggtgacgtcg ttcgagtgaa ccagatcgcg caggaggccc ggcagcaccg 7140 
j^ataatcag gccgatgccg. acagcgtcga gcgcgacagt gctcagaatt acgatcaggg 7200 
tgttggg tttcacgtct ggcct.ccgga ccagcctccg ctggtccg;at: tgaacgcgcg 7260 
Fattctttat cactgataag ttggtggaca tattatgttt atcagtgata aagtgtcaag 7320 
, catgacaaag ttgcagccga atacagtgat ccgtgccgcc ctggacctgt . tgaacgaggt 7380 
cggcgtagac ggtctgacga cacgcaaact ggcggaacgg ttgggggttc agcagccggc 7440 
gctttactgg cacttcagga . acaagcgggc gctgctcgac gcactggccg aagccatgct 7500 
ggcggagaat catacgcatt cggtgccgag agccgacgac gactggcgct catttctgat 7560 . 
I cgggaatgcc cgcagcttca ggcaggcgct gctcgcctac cgcgatggcg cgcgcatcca 7620 
tgccggcacg cgaccgggcg caccgcagat ggaaacggcc gacgcgcagc ttcgcttcct 7680 
ctgcgaggcg ggtttttcgg ccggggacgc cgtcaatgcg ctgatgacaa tcagctactt 7740 
cactgttggg gccgtgcttg aggagcaggc cggcgacagc gatgccggcg agcgcggcgg 7800 
caccgttgaa caggctccgc tctcgccgct gttgcgggcc gcgatagacg ccttcgacga 7860 
agccggtccg gacgcagcgt tcgagcaggg actcgcggtg attgtcgatg gattggcgaa 7920 
aaggaggctc gttgtcagga acgttgaagg accgagaaag ggtgacgatt gatcaggacc 7980 
tgccggag cgcaacccac tcactacagc agagccatgt agacaacatc ccctccccct 8040 
ccaccgcg tcagacgccc gtagcagccc gctacgggct ttttcatgcc ctgccctagc 8100 
gtccaagcct cacggccgcg ctcggcctct ctggcggcct tctggcgctc ttccgcttcc 8160 
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 8220 
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 8280 
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 8340 
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 8400 
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 8460" 
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 8520 
ttccgctgca taaccctgct tcggggtcat tatagcgatt ttttcggtat atccatcctt 8580 
tttcgcacga tataCaggat tttgccaaag ggttcgtgta gactttcctt ggtgtatcca 8640 
acggcgtcag ccgggcagga taggtgaagt aggcccaccc gcgagcgggt gttccttctt 8700 
cactgtccct tattcgcacc tggcggtgct caacgggaat cctgctctgc gaggctggcc 8760 
ggctaccgcc ggcgtaacag atgagggcaa gcggatggct gatgaaacca agccaaccag 8820 
gaagggcagc ccacctatca aggtgtactg ccttccagac gaacgaagag cgattgagga 8880 



aa 
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aaaggcggcg gcggccggca tgagcctgtc ggcctacctg ctggccgtcg gccagggcta 8940 
caaaatcacg ggcgtcgtgg actatgagca cgtccgcgag ctggcccgca tcaatggcga 9000 
cctgggccgc ctgggcggcc tgctgaaact ctggctcacc gacgacccgc gcacggcgcg 9060 
gttcggtgat gccacgatcc tcgccctgct ggcgaagatc gaagagaagc aggacgagct 9120 
tggcaaggtc atgatgggcg tggtccgccc gagggcagag ccatgacttt tttagccgct 9180 
aaaacggccg gggggtgcgc gtgattgcca agcacgtccc catgcgctcc atcaagaaga 9240 
gcgact!tcgc ggagctggtg aagtacatca ccgacgagca aggcaagacc gagcgccttt 9300 
• gcgacgctca ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca 9360 
aacgcgccag. aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga 9420 
tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 9480 
. gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg. gccggcgacg 9540 
tggagctggc cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag 960.0 
tgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 9660 
gacagat gaggggcgcg .atccttgaca cttgaggggc agagtgctga cagatgaggg 9720 
fcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 9780 
ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 9840 
ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 9900 
ggtgcccccc cttctcgaac cctcccggcc . cgctaacgcg ggcctcccat ccccccaggg 9960 
gctgcgcccc tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc 10020 
cattgccggg atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag 10080 
cattgacgtg ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg 10140 
cggcggcctg ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat 10200 
ggcggggccg gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgt get. 10260' 
cgtgttcggg ' ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg 10320 
aggtatgaaa acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa 10380 
agctaccaag acgaagagga tgaagaggat gaggaggcag attgccttga. atatattgac 10440 
tactgata agataatata tcttttatat- agaagatatc gccgtatgta aggatttcag 10500 
ggcaaggc ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa 10560 
cttgcatgga ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca 10620 
taattgggta atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac 10680 
tttgtcatgc agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag 10740 
gtgctgcctc agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac 10800 
gtgcagcttt cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac 10860 
cacgtcaaag ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc 10920 
gaatacgtgc gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg 10980 
gcgcgattta gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc 11040 
actgcccggc tgtatgcgcg aggttaccga ctgcggcctg agtttt;ttaa gtgacgtaaa 11100 
atcgtgttga ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg 11160 
gccatatcaa tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt 11220 
tgccatgttt tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg 11280 
ttacgcacca ccccg.tcagt agctgaacag gagggacagc tgatagacac agaagccact 11340 
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ggagcacctc aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat. 1140.0 •• 
tgtggtttca aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaapttt 11460 
gaaaaagctg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 11520 
gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 11580 
aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct 11640 
gcgtaaaaga tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg 11700 
aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 11760 
, ' gggaaaagga catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact 11820 
tfcgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 11880 
cggaagagta tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca 11940 
tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc tfeagacagcc 12000 
gcttagccga attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact 12060 
gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa 12120 

•cccgaaga ggaacttgtc . ttttcccacg gcgacctggg agacagcaac atctttgtga 12180 
gatggcaa agtaagtggc ttfcattgatc ttgggagaag cggcagggcg gacaagtggt 12240 • 
atgacattgc cttctgcgtq cggtcgatca. gggaggatat cggggaagaa cagtatgtcg 12300 
agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 12360 
tactggatga afetgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag 12420 
cgcaccgact tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat 12480 
ttgggcaagg g^tcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag 12540 
gacggccaga cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc 12600 
aaggcaccag gcgggtcaaa fccagg'aataa gggcacattg ccccggcgtg agtcggggca 12660 
atcccgcaag gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg 12720 
-atcgacgcgg ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt 12780 
gcgccccgcg aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc 12840 
gagcgcgaca gcgtgcaact ggctcccccfc gcictgcccg cgccatcggc cgccgtggag 12900 

Jgttcgcgtc gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg 12960 
(jaggaacta tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc . 13020 
agcgaggcca agcaggccgc gttgcfegaaa cacacgaagc agcagatcaa ggaaatgcag 13080 
ctttccttgt tcgatatt,gc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg 13140 
gcccgctctg ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac 13200 
aaggtcattt tccacgtbaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg 13260 
gcdgacgatg acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc 13320 
ggcgagccga tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat 13380 
ggccggtatt acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc 13440 
ttcacgtccg accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc 13500 
ctggaccgtg gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgfcg 13560 
ctgtttgctg gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg 13620 
acggcccgac ggatgttcga ctatttcagc tcgcaccggg agccgtac.cc gctcaagctg i3680 
gaaaccttcc gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag 13740 
gtcggcgaag .cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat 13800 




• 
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gatgacctgg tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca 13860 
gcagccagcg ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc 13920 
gctcagtatc gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa 13980 
aattgacaat tgtgattaag gctcagattc gacggcttgg agcggccgao gtgcaggatt 14040 
tccgcgagat ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg 14100 
agcacgagga gaaa:aagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat 14160 
tcggcgccta catcgacggc gagatcattg ggctgtcggt cttpaaacag gaggacggcc 14220 
ccaaggacgc tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc 14280 
gaggggtcgc cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg 14340 
tccgacagat tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata 14400/ 
• tttcgctatt cfcggagcttg ttgtttattt cggtctaccg eotgccgpgc ggggtcgcgg 14460 
cgacggtagg cgctgtgcag. ccgctgatgg tcgtgttcat ctctgccgc£ ctgctaggta 14520 
gcccgatacg attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt 14580 
tgttgac accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg 14640 
tttccat ggegttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc 14700 
tcacctttac cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag 14760 
tgtttgatcc gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg 14820 
gcctgatcgg agcgggttta acptacttcc tttggttccg ggggatctcg cgactcgaac 14880 
ctacagttgt ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga 14940 
tgcatcaggc cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg 15000 
ataggggagi tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc 15060 
agcggcttta tccagcgatt .tccfcattatg tcggcatagt tctcaagatc gacagcctgt 15120 
cacggttaag cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga 15180 
tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta pcctccgcga 15240 
gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac 15300 
atgagcaaag tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg 15360 

I L tgcctgtat cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct 15420 
ftggcagga tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg 15480* 
cggacgtttt taatgtactg' gggtggtttt tcttttcacc agtgagacgg gcaacagctg 15540 
attgcccttc accgcctggc cctgagragag ttgcagcaag ' cggtccacgc tggtttgccc 15600 
cagcaggcga aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca 15660 
aaagaatagc ccgagatagg gttigagtgtt gttccagttt ggaacaagag tccactatta 15720 
aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 15780 
cgtgaaccat cacccaaatc aagttttttg gggtcgaggt. gccgtaaagc act^aatcgg 15840 
aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 15900 
aaggaaggga agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg 15960 
gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgc.tgcaag 16020 
gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 16080 
tgaattcgag ctcggtaccc ggg 16103 
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<210> 4 
<211> 15739 

<212> DNA : * 

<213> Kunstliche ' Sequenz 

<220> 

<223> Beschreibung der kiinst lichen Sequenz : Vector 
<400> 4 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 
cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 
cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 
cttctgatcc agtcgatcat .ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 
gggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agcfettctca 3,00 
icagggcca gcccaagacc gacaaggcct .ccctccagaa cgccgagaag aactggaggg 360 
gtggtgtcaa ggaggagtaa gctccttatt g^agtcggag gacggagcgg tgtcaagagg 420 
atattcttcg actctgrfcatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 
tttggatt.tg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 
aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 
gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 
ggatgtcgaa ggcttggggc acctgc&ttg gttgaattta gaacgtggca ctattgatca 720 
tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagrccacctt cagtggactc gagtaccatt taattctatt 960 ' 
tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 
fgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 
atacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 
^ttgaccggt .gcctggatct tcctatagaa tcatccttat jbcgttgacct agctgattct 1200 
ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 
aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 
gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 
ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 
aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 
tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 
cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
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agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
tttcttttcc catcttpagt atattcatct tcccatccaa gaacctttat . ttcccctaag 2Q40 
taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 
gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 
gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 
ggagggcgtg gatatgtcct .gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 
tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 
gaccfcgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggp catggatgcg .2520 
atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 
ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 
tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 
pctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 
felP&caatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 
ttcggggath cccaatacga ggtcgccaac atcttcttctf ggaggccgtg gttggcttgt 2880 
atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 
ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 
aatttcgatg atgcagcttg ggcgcagggt' cgatgcgacg caatcgtccg atccggagcc 3060 
gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggfctgt 3120 
gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 
tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 
atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 
pgaagagaa gaatagctta gcagagctat tttcattttc * gggagacgag atcaagcaga 3540 
aacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 
atatttgtct ctaattgtac tttgacatgc tcctcttc'tt . tactctgata gcttgactat 3660 
gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
ctcaagccta caggacacac attcafccgta ggtataaacc tcgaaatcan ttcctactaa 3780 
gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 
gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 
cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtaptgtg taagcgccca 3960 
ctccacatct ccactcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt 4020 
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4080 
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4140 
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4200 
cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4260 
ggagggaagg taaatattga qggaaattat tcattaaagg tgaattatca ccgtcaccga 4320 
cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4380 
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ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4440 
caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4500 
ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4560 
aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4620 
agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4680 
aacafcagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4740 
atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4800 
gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4860 
atcatcgcaa gaccggrcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4920 
cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4980 
atafccgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgrccgtt gatgtggacg 5040 
ccgggcccga tcatattgtc • gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 5100. 
gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 5160 

•patgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag 5220 
caaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc 5280 
gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5340 
agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg, aagcggtcag 5400 
cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5460 
ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5520 
tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5580 
gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5640 
catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5700 
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5760 
ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5820 
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5880 
- aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc', agttcattca 5940 

•gcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 6000 
acggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 6060 
ccacccaagc ggccggagaa cctgqgtgca atccatcttg ttcaatcatg cgaaacgatc 6120 
cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 6180 
• gggaatttat ggaacgtcag tpgagcattt ttgacaagaa atatttgcta gctgatagtg 6240 
accttaggcg acttttgaac gcgcaataat ggfcttctgac gtatgtgctt agctcattaa 6300 
actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6360 
taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6420 
tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6480 
ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6540 
gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6600 
tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6660 
gcccagcapa ggtgcg^agg caaattgcac caacgcatac agcgccagca gaatgccata 6720 
gtgggcgg'tg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6780 
aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6840 
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gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6900 
ctttatcact gataagttgg tggacatatt atgtttatca gbgataaagt gtcaagcatg 6960 
acaaagttgc agecgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 7020 
gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca. gccggcgctt 7080 
tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 7140 
gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 7200 
aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7260 
ggcacg.cgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7320 

gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 73 80 
gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7440 . 
gttgaacagg ctccgcfcctc gccgctgttg cgggccgcga, tagacgcctt cgacgaagcc 7500 
gtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7560 
jgctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7620 
fcggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7680 
accgcgtcag acgcccgtag cagcccgcta cggg.cttttt catgccctgc cctagcgtcc 7740 
aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7800 
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7860 
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7920 
gccagcaaaa ggccaggaac- cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7980 
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga* aacccgacag 8040 
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 8100 
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 8160 
gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 8220 
gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggfcg tatccaacgg 8280 
cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact 83^0 
tcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8400 
ccgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8460 
ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8520 
gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8580 
atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8640 
ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg. acccgcgcac ggcgcggttc 8700 
ggtgatgcca cgatcctcgc cctgctggcg aa&atcgaag agaagcagga cgagcttggc 8760 
aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gacttttfcta gccgctaaaa 8820 
cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8880 
cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8940" 
cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 9000 
cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 9060 
tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 9120 
actcacccgg cgcggcgttg acagatgagg ggcaggctcg abttcggccg gcgacgtgga 9180 
gctggccagc cfccgcaaatc ggcgaaaacg cctgatttta cgcgagtttg ccacagatga 9240 
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tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gqgactactg 9300 , 
acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9360 
acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9420 
gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9480 
accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9540 
cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg -9600 
cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9660 
gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9720 
gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9780 
ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9840* 
gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9900 
ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt. ataccgaggt 9960 
atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 10020 
:aagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 10080 
'gataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 10140 m 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 10200 
catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt c tat cataat 10260 
tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10320. 
tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10380 
tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10440 
agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10500 
tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10560 
acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gc&ctggcgc 10620 
gatttagccc cgac.atagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10680 
cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg .10740 
tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10800 
tcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10860. 
;gttttacg gcagtgagag cagagat'agc gctgatgtcc ggcggtgctt ttgccgttac 1092Q 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 1098.0 
cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 11040 
gtttcaaaat cggctccgtc gatactatgt- tatacgccaa ctttgaaaac aactttgaaa 11100 
aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 11160 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ' ggaaataata 11220 
aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11280 
aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11340 
cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg* tggaacggga 11400 
aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga. 11460 
acggcatgat ggctggagca ate tgc teat gagtgaggee gatggegtec tttgctcgga- 11520 
agagtatgaa gatgaacaaa gecctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11580 
gctctttcac tccatcgaca tateggattg tccctatacg aatagcttag acagccgctt 11640 
agecgaattg gattacttac tgaataacga tetggecgat gtggattgcg aaaactggga 11700 
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agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11760 . 
cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11820 
tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca* agtggtatga 11880 
cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11940 
attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 12000 
ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 12060 
ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 12120 
gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 12180 
gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12240 
caccaggcgg gtcaaatcag gaataagggc acattgeccc ggcgtgagtc ggggcaatcc 12300 
cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12360 
acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 12420 
cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12480 
tgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12540 
'cgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgacbatc gacacgcgag 12600 
gaactatgac gaccaagaag .cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12660 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12720 
ccttgtt'cga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12780 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12 840 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12900 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12960 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 1302 0 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 13080 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 13140 
accgtggcaa gaaaacgtcc cgttgccagg t<:ctgatcga cgaggaaatc gtcgtgctgt 132Q0 
ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13260 
•ccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 1332 0 
ttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13380 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13440 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13500 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13560 
agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13 620 
gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13680 
cgagatccga ttgtc'ggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13740 
cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13800 
cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13860 
ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13920 
ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13980 
acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 14040 
gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 14100 
ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc .taggtagccc 14160 
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gatacgattg atggcggtcc fegggggctat ttgpggaact gcgggcgtgg cgctgttggt 14220 
gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14280 
ttccatggcg ttcggaaccg tgctgacccg caagtggcaa c.etcccgtgc ctfctgctcac 14340 
ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14400 
tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14460 
gatcggagcg ggtttaacet acttcctttg gttccggggg atctcgcgac tcgaacctac 14520 
agttgtttcc ttactgggct ttctcagccc cagatctggg gfccgatcagc cggggatgca 14580 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14640 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 147 00 
gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14760 
gttaagcgag aaatgaataa gaaggctgat aattcggatc . tctgcgaggg agatgatatt 1482 0 
. tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14880 
atccgtgttt caaa'cccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14940 
^^^^taagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 15000 . 

. ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 15060 
gcaggatata ttgtggtgta* aacaaattga cgcttagaca acttaataac acattgcgga 1512 0 
cgtttttaaf gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 15180 
cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15240 
aggcgaaaat cctgtttgat * ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15300 
aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 153 60 

. acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15420 
aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatc^gaacc 15480 
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15540 
aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15600 
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15660 

•aagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15720 
cgagctcg gtacccggg 15739 

i 4 

* : 

<210> 5 
<211> 11611 
' <212> DNA " 
<213> Kiinstliche Sequenz 

<220> 

<223> Bescnreibung der kiinstlichen Sequenz : Vector 
<400> 5 

agcttgcatg cctgcaggtc gagtggagat gtggagtggg cgcttacaca gtacacgagg 60 
acttctagct agaaagaagg attacctcta aacaagtgta cctgtgcatt ctgggtaaac 120 
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gaetcatagg agagttgtaa aaaagtttcg gccggcgtat tgggtgttac ggagcattca 180 
ctaggcaacc atgcatggtt actattgtat accatcttag* taggaantga tttcgaggtt 240 
tatacctacg atgaatgtgt gtccfcgtagg cttgagagtt caaggaagaa acatgcaatt 300 
atctttgcga acccaggngc tggtgacgga attttcatag tcaagctatc agagtaaaga 360 
agaggagcat gtcaaagtac aattagagac aaatatatag tcgcgtggag ccaagagcgg 420 
attcctcagt ctcgtaggtc tcttgacgac cgttgatctg cttgatctcg . tctcccgaaa 480 
atgaaaatag ctctgctaag ctattcttct cttcgccgga gcctgnaagg cgttactagg 540 
ttgcagtcaa tgcattaatg cattgcagat gagctgtatc tggaagaggt aaacccgaaa 600 
acgcgtttta ttcttgttga catggagcta ttaaatcact agaaggcact ctttgctgct 660 
tggacaaatg aacgtatctt atcgagatcc tgaacaccat ttgtctcaac tccggagctg 720 
acatcgacac caacgatctt atatccagat tcgtcaagct gtttgatgat ttcagtaacg 780 
ttaagtggat cgatcccgcg gtcggcatct actctattcc tttgccctcg- gacgagtgct. 840 
rgggcgtcgg tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc 900 
Jttctgcgg gcgatttgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc 960 
fcatcgaccc tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag 1020 
ttggtcaaga ccaatgcgga gcatatacgc ccggagccgc ggcgatcctg caagctccgg 1080 
atgcctccgc tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcctccagaa 1140 
gaagatgttg gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac 1200 
cgctgttatg cggccattgt. ccgtcaggac attgttggag ccgaaatccg cgtgcacgag 1260 
gtgccggact tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac 1320 
ggacgcactg acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat 1380 
cgcgcatatg aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc ' cgaatgggcc 1440 
gaacccgctc gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg 1500 
ctgcagaaca gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg 1560 
gcgggagatg caataggtca ggctctcgct gaattcccca atgtcaagca cttccggaat 1620 
cgggagcgcg gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc 1680 
agctattt acccgcagga catatccacg. ccctcctaca tcgaagctga aagcacgaga 1740 
:cttcgccc tccgagagct gcatcaggtc ggagacgctg tcgaactfctt cgatcagaaa 1800 
cttctcgaca gacgtcgcgg tgagttcagg catggtgatg tctgctcaag cggggtagct 1860 
gttagtcaag ctgcgatgaa gtgggaaagc tcgaactgaa aggttcaaag gaataaggga 1920 
tgggaaggat ggagtatgga tgtagcaaag tacttactta ggggaaataa aggttcttgg 1980 
atgggaagat gaatatactg aagatgggaa aagaaagaga aaagaaaaga gcagctggtg 2040 
gggagagcag gaaaatatgg caacaaatgt tggactgacg caacgacctt gtcaaccccg 2100 
ccgacacacc gggcggacag acggggcaaa gctgcctacc agggactgag ggacctcagc 2160 
aggtcgagtg cagagcaccg gatgggtcga ctgccagctt gtgttcccgg tctgcgccgc 2220 
tggccagctc ctgagcggcc tttccggttt catacaccgg gcaaagcagg agaggcacga 2280 
tatttggacg ccctacagat gccggatggg ccaattaggg agcttacgcg ccgggtactc 2340 
gctctaccta cttcggagaa ggtactatct cgtgaatctt tfcadcagatc ggaagcaatt 2400 
.ggacttctgt acctaggtta atggcatgct atttcgccga cggctataca cccctggctt 2460 
cacattctcc ttcgcttact gccggtgatt cgatgaagct ccatattctc cgatgatgca 2520 
atagattctt ggtcaacgag gggcacacca gcctttccac ttcggggcgg aggggcggcc 2580 
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ggtcccggat taataatcat . ccactgcacc tcagagccgc cagagctgtc tggccagbgg 2640 
cttattactc agcccttctc tctgcgtccg tccgtctctc cgcatgccag aaagagtcac 2700 
cggtcactgt acagagctca cgagttcgtc acatttttct acaaatggtg gaggcggcgg 2760 
attttaggct caagtcatga ccctctgggt cactccagaa tcagctaggt caacgaataa 2820 
ggatgattct afeaggaagat ccaggcaccg - gtcaaccatg atctggacag atttgggagc 2880 
tcggtataag ctctccacct atcttattct gtatagttta ggcttaaagt ttatccagga 2940 
gatgttgctg aagtcgattt gagtccactt cctcactggt agctatacga ctttgatggt 3000 
cgttgtaggg gctgtattag gtctcgatca aacacaaata gaattaaatg gtactcgagt 3060 
ccactgaagg tggcttctcc gtcttccgta gccgtgccga aatccttaca gcttgtgttg 3120 
tgtgactttt ggttacgccg tctgactttt gtggtgagct aactagagat catgctatat 3180 
. ; ■ ctcctgattt aatacaatgc tcatcataac attccacchg gaactgctag caacgtttga 3240 
cttgcattgt gcaacgccct ttgcagagct atcggatgat caatagtgcc acgttctaaa 3300 

«ttcaaccaac gcaggtgccc caagccttcg acatccggat gtatttcgaa aacctcatgg 3360 
■rattgcagt cctcagattc atgttcattc caatgctcat tggtgaataa aaggttcaca 3420 
gggaataagt tcaaactcga gatacttgag aatattgaaa gccaaaggac cctctatgct 3480 
ccaagctaga gtctcagcct ggaaagcaaa tccaaatgaa gctatgctac ctccaattcc 3540 
tcatcatctt atctataata cagagtcgaa gaatatcctc , ttgacaccgc tccgtcctcc 3600 
gacttcaata aggagcttac tcctccttga caccacccct ccagttcttc tcggcgttct '3660 
ggagggaggc cttgtcggtc ttgggctggc cctggctgag aaagctgttg gcagccttaa 3720 
agggacgctg gaggtcacca gtcgctggct tcccgaagac gtggatctta accagattcg 3780 
.aaagcgcctt . cagcggatga tcgactggat cagaagagcg ttggtgtact tgaagtacag 3840 
atgcatgacg gccatcatgc caacgcccat gaactggctc ttaatgagct ggcggaactg 3900 
gcccttatcg tactccatgt tggtagttgt gacaggacga ggctcctcgc cgcttccaag 3960 
cggagcaggc tcgacgta!tt tcagtgftcga. aagatctgat caagagacag gatgaggatc 4020 
gtttcgcatg attgaacaag atggattgca pgcaggttct ccggccgctt gggtggagag 4080 
gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 4140 

•ctgtcagcg caggggcgcc . cggttctttt -tgtcaagacc gacctgtccg gtgccctgaa 4200 
gaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4260 
agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4320 
ggggcaggat ctcctgtcat! ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4380 
tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4440 
acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 450.0 
ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4560 
gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4620 
ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4680 
tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4740 
ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4800 
ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4860 
cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920 
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980 
ttcttcgccc accccgggct cgatcccctc gcgagttggt tcagctgctg cctgaggctg '5040 
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gacgac'ctcg cggagttcta ccggcagtgc aaatccgtcg gcatccagga aaccagcagc^ 5100 
ggctatccgc gcatccatgc ccccgaactg caggagtggg gaggcacgat ggccgctttg 5160 
gtccggatct ttgtgaag;ga accttacttc tgtggtgtga cataattgga caaactacct 5220 
' acagagattt aaagctctaa ggt'aaatata aaatttttaa gtgtataatg tgttaaacta 5280 
ctgattctaa ttgtttgtgt attttagatt ccaacctatg gaactgatga atgggagcag 5340 
tggtggaatg cctttaatga ggaaaacctg ttttgctcag aagaaatgcc atctagtgat 5400 
gatgaggcta ctgctgactc tcaacattct actcctccaa aaaagaagag aaaggtagaa 5460 
gaccccaagg actttccttc agaattgcta agttttttga gtcatgctgt gtttagtaat 5520 
agaactcttg cttgctttgc tatttacacc acaaaggaaa aagctgcact gctatacaag 5580 
aaaattatggaaaaatattc tgtaaccttt ataagtaggc ataacagtta taatcataac 5640 
atactgtttt ttcttac'tcc acacaggcat agagtgtctg ctattaataa ctatgctcaa 5700 
aaattgtgta cctttagctt tttaatttgt aaaggggtta ataaggaata tttga'tgtat 5760 

Iagtgccttga ctagagatca taatcagcca taccacattt gtagaggttt tacttgcttt 5820 
aaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 5880 
Lcttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 5940 
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 6000 
ttatcatgtc tggatctgae . gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct . 6060 
, aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 6120 
aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 6180 
ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg 6240- 
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 63 00 
tacggttatc cacagaatca ggggataacg. caggaaagaa catgtgagca aaaggccagc 63 60 
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 6420 
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 6480 
gacaggacta .taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 6540 
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6600 
fctcatagc tcacgctgta ggtatctcag ttcggtgtag gfecgttcgct ccaagctggg 6660 
;gtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6720 
. tgagtccaac . ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 67,80, 
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6840 
ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6900 
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6960 
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 7020* 
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 7080 
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 7140 
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 7200 
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 7260 
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 7320 
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 73 80 
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 7440 
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt 7500 
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gtcacgctcg tcgtttggta tggcttcatt cagctccggt" tcccaacgat caaggcgagt 7560 
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7620 
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 7680 
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7740 
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 7800 
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7860 
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7920 
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7980 
aaatgccgqa aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 8040 
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 8100 
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 8160 
tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 8220- 
gccctttcgt cttcaagaat tcgcggccgc aattaaccct cactaaagga tccctatagt 82 80 
tcgtatt atgcggccgb gaattctcat gtttg'accgc ttatcatcga taagc.tctgc 8340 
tttgttga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 8400 
ccaaaaagct cgctttcagc aectgtcgtt tcctttcttt tcagagggta ttttaaataa 8460 
aaacattaag ttatgacgaa gaagaacgga aacgccttaa accggaaaat tttcataaat 8520 
agcgaaaacc cgcgaggtcg ccgccccgta acaaggcgga tcgccggaaa ggacccgcaa 8580 
atgataataa ttatcaattg catactatcg acggcactgc tgccagataa caccaccggg 8640 
gaaacattcc atcatgatgg ccgtpgcggac ataggaagcc agttcatcca tcgctttctt 87 00 
gtctgcfgcc atttgctttg tgacatccag cgccgcacat tcagcagcgt ttttcagcgc 8760 
gttttcgatc aacgtttcaa tgttggtatc aacaccaggt ttaactttga acttatcggc 8820 
actgacggtt accttgttct gcgctggctc atcacgcagg ataccaaggc tgatgttgta 8880 
gatattggtc accggctgag ggttttcgat tgccgctgcg tggatagcac catttgcgat 8940 
caggcngtcc ttgatgaatg acactccatt gcgaataagt tcgaaggaga cggtgtcacg 9000 
aatgcgctgg tccagctcgg tcgattgcct tttgtgcagc agaggtatca atctcaacgc 9060 
aggctcat cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa 9120 
gcaaat.tt ctgcccttct gatgtcagaa aggcaaagtg attttctttc tggtattcag 9180 
ttgctgtgtg tcggtttcag caaaaccaag .ctcgcgcaat tcggctgtgc agatttagaa 9240 
ggcagatcac cagacagcaa cggccaacgg aaaacagcgc atacagaaca tccgtcgccg 93 00 
cgccgacaac gtgataattt ttatgaccca tgatttattfe ccttttagac gtgagcctgt 9360 
cgcacagcaa agccgecgaa agttcctcga agctagcttc agacgtgtct agatacgtct 9420 
gctttttgtt gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga 9480 
ggccaaaaag ctcgctttca gcacctgtcg tttcctttct tttcagaggg tattttaaat 9540 
aaaaacatta agttatgacg aagaagaacg gaaacgcctt aaaccggaaa attttcataa 9600 
atagcgaaaa cccgcgaggt . cgccgccccg taacaaggcg gatcgccgga aaggacccgc 9660 
aaatgataat aattatcaat tgcatactat cgacggcact gctgccagat aacaccaccg 9720 
gggaaacatt ccatcatgat ggccgtgcgg acataggaag ccagttcatc catcgctttc 9780 
ttgtctgctg ccatttgctt tgtgacatcc agcgccgcac attcagcagc gtttttcagc 9840 
gcgttttcga tcaacgtttc aatgttggta tcaacaccag gtttaacttt gaacttatcg 9900 
gcactgacgg ttaccttgtt ctgcgctggc tcatcacgca ggataccaag gctgatgttg 9960 
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tagatattgg tcaccggctg agggttttcg attgccgctg cgtggatagc accatttgcg 10020 
atcaggcngt ccttgatgaa tgacactcca ttgcgaataa gttcgaagga gacggtgtca 10080 
cgaatgcgct ggtccagctc ggtcgattgc cttttgtgca gcagaggtat caatctcaac 10140 
gccaaggctc atcgaagcgc aatattgctg ctcaccaaaa cgcgtattga ccaggtgttc 10200 
aacggcaaat ttctgccctt ctgatgtcag aaaggcaaag tgattttctt tctggtattc 10260 
agttgctgtg tgtcggtttc agcaaaacca agctcgcgca attcggctgt gcagatttag 10320 
aaggcagatc accagacagc .aacggccaac . ggaaaacagc gcatacagaa catccgtcgc 10380 
cgcgccgaca acgtgataat ttttatgacc catgatttat ttccttttag acgtgagcct 10440 
gtcgcacagc aaagccgccg aaagttcctc gaccgatgcc cttgagagcc ttcaacccag 10500 
tcagctcctt ccggtgggcg - cggggcatga ctatcgtcgc cgcacttatg actgtcttct 10560 
ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc ggcgaggacc 10620 
gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 10680 
ccctcgctca agccttcgtc actggtcccg ccaccaaacg .tttcggcgag aagcaggcca 10740 
tcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 10800 
itggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 10860 
tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 10920 
tcg.cggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 10980 
* ccgcctcggc gagcacatgg aacgggttgg . catggattgt aggcgccgcc ctataccttg 11040 
tcfcgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tgaatggaag 11100 
ccggcggcac ctcgctaacg gattcacoac tccaagaatt ggagccaatc aattcttgcg 11160. 
gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt ccgccatctc 11220 
cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tgcagatccg gctgtg'gaat 11280 
gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 11340 
atgcatctca attagtcagc aaccaggtgt ggaaa&tccc caggctcccc agcaggcaga.il 4 00 
agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 11460 
atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 11520 
tatttat$ cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga 11580 
cttttttg gaggcctagg cttttgcaaa a 11611 



<210> 6 
<211> 17 
<212> DNA 

<213> Kxinstliche Seguenz- 

<220> . • 

<223> BescJareibung der kiinstlichen Sequenz : Primer 

<400> 6 

gcngarggna thtggta 17 
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<211> 20 ' , 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinst lichen Sequenz : Primer 
<400> 7 

tcngcnagra adatrttrtg 20 




10> 8 
11* 27 
<212> DNA * 

<213> Kunstliche Sequenz \ * 

<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 8 

aagtgacacc ggttacacgc ttgtctt '27 



<210> 9 
11> 27 
12> DNA 
<213> Kiinstliche Sequenz 



<220> 

<:223> Beschreibung der kunstlichen Seguenz : Primer ■ 
<400> 9 

gcttatcacc atctgttacc tccttgc 27 
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<211> 2981 

<212> DNA 

<213> Blakeslea trispora 
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<400> 10 

tctagaattc attccattcg aaaggatcaa cataaccaat ttaatgacta ctagctaatg * 60 

gatacaaata tacgcacaaa aaaagaaaga attctatgat caaagagaac acagacacag 120 

. agtgatacat ttaaatggtt aagttcttat gatgttaaaa tggtaacttt attattgaat 180 

taaatgcgaa tatcgttgct gcfettgtact tggaaaacgt taggtaaaag ttggttaatg 240 

aaagaagcag gagttgtagt atcatctctt gggaagaaat agaaaaagag gaaagtaaca 300 

^^^gtaacaag caagacaata atagatcca'a tggctttcgg tcttacgagt ttgttcagga 3 60 

gcatacttct tttggctatc ttgtaacttt cttggtaagg gattctggcc aaagctttta 420 

cagacttggt cggaagtaag cttacttcca gcaagaacga taggaacacc agtacctgga 480 

tgtgtactac aaagaaaaga gaaatgagta cgtgcgttat taaaaaaaag aaaaaaagag 540 

ggcaaaagta ttacctagct ccgacaaaga aaagattatc ataacggttt gtggaatcct ' 600 

tggtactagg tctgaaccag agaacttgga acacatcatg' agaaagacca agaatagaac 660 

ctctccaaag gttaaacttg ctttgccaaa cactaggatc attcacttct tcatgttcaa 720 

^^^^caaattagc aaagttgttt actcccaaac gacgttcgat aacttccaga accatcttgc 780 

gtgcacggtt taccaactca ggataatttt cttcagcact gtttcctgtc ttactcttca 840 

tatggccaat tggaaccaac acaataatgg agtccttgtt gggaggtgcg gcagattcat 900 

caattcgaga tggaacgttg acatagaatg aagcttcaga gggcaaaccg aagtcgttga 960 

aaatctcatc aaaactttcc ttgtaggctt cagccaagaa gatattgtgt acgtctaatt 1020 

gaggcacctt tgttgacatg gaccaataaa acgaaataga tgatgaagtg agtttctttg 1080 

aggctaatgt cttctttgtc caattgcaag gaggtaacag at'ggtgataa gcataaacaa 1140 
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gatccgcatt acatacgact gcatcggctt caatgacttc tccgctttcc aaagtgacac 1200 

cggttacacg cttgtcttta tcgacagtgt taattttagc aacaggcgat tgatatctga 1260 

attcagcacc gtactttttg gaggcgatag actcaagctt ctgaacaacc atgttgaaac 1320 

1 

caccacgagg ataccagata ccttcagcaa actcggtgta ttgtaacaaa ctgtaaactg 1380 

1 ctggagcatc ataaggcgac atfactatatt ccaaaaatag aaaatagaac aatgaatatc 1440 

. aaaattcctt tcacttgccc tttttcacat ttctcttttc ccacccccga ccggtctcac 1500 

tcattttttt ttcatcccac accacgcgtt gtatgtgtac ttaccccata tacattgttt 1560 

aaagtaiaa agccatacgc attttcttgg tttggaaata tttactggct cggtcataga 1620 

tcttaccaaa caagfcgcaag cgaaagattt caggcacata ctgaagacga atcaaatccc 1680 

aaatggtjttc aaagttgcgc ttgatagcaa taaatgtacc ttgttcataa tggacatgtg 1740 

tttccttcat ^gaaatccaag aatqtaccaa atccaagggg accctcaata cggtccaatt 1800 

cgcccttcat cttggttaaa tcggaagaga gttgtacggc atcaccgtcg tcaaaatgaa 1860 

ccttatagtt attgtcacag cgaagcaaat ccaaatgatc accaatacgt tcatccaaat 1920 

gcaaatgc atcttcaaaa agcttaggca tcaaatagag tgagggaccc tgatcaaagc 1980 

gatgaccatc gtgatgaatg aatgaacaac ggccaccgga aaagtcgttc ttttcaafcaa 2040 

cagtaactcg aaaaccttca cgagcaagac gagcagcagt agcagttccg ccaataccgg 2100 

caccaatgac aacaatatgc ttcttttgat cagacatgag attaaaatag ataaggaaaa 2160 

gaaagtgaaa agaaattcgg aagcatggca cattcttctt tttataaata catgcctgac 2220 

tttctttttc catcgatatg atatatgcafc atgatagata tacaagcaat cttcttcaag 2280 

gagtttgaaa ttttgtcctc caggagcaaa aaaaagtttt tttttataca tgtttgtaca 2340 
caagaktagt taccaatttg ctttggtctt acgtgctgca agtttatatc gttttcaatt . 2400 
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tctttgtctt tacattttct tfcgtccttta* tctttcctca tttagtcttt gggagaatta 2460 

ggaaaaggga gcggaaaggt aagaaatgct tgcgtatttt actaafctcgg caaacatcca 2520 

atttggcaaa cagcagcctg tgcaacgctc tcgagatgac agtatctttg attacactct. 2580 

aaatctcgat gacccgacca aaaagagcga acaaagaaat aatcttgtgc attcgaatat 2640 

gatggaagat tttttccccc ttattctaaa tgttgacata gcgtgtatgt tatataaaca. 2700 

, . • . ' 

aaaagaaatt gtacaaactt tcttttcttc tctttttatt ttatctctat gtcaatactc 2760 

tatctgg aatttcatct ctactataca ctacctgtcc ttgcggcatt gtgttggctg 2820 

ctaaagccgt ttcactcaca gcaagacaat ctcaagtata aatttttaat gttgatggcc 2880 

gcctctaccg catcgatttg ggacaattat atcgtttatc atcgcgcttg gtggtactgt 2940 

cctacttgtg ttgtggctgt cattggctat gtacctctag a 2981 

<210> 11 . 

<211> 1749 
<212> DNA 

13> -Blakeslea trispora 

\ 

<400> 11 

atgtctgatc aaaagaagca tattgttgtc attggtgccg gtattggcgg aactgctact 60 

gctgctcgtc ttgctcgtga aggttttcga gttactgttg ttgaaaagaa cgacttttcc 120 

ggtggccgtt gt teat teat tcatcacgat ggtcatcgct ttgatcaggg tccctcactc 180 

tatttgatgc ctaagctttt tgaagatgca tttgctgatt tggatgaacg tattggtgat 240 

» 

catttggatt tgcttcgctg tgacaataac tataaggttc attttgacga cggtgatgcc 300 

gtacaactct cttccgattt aaccaagatg aagggcgaat tggaccgtat tgagggtccc 360 
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cttggatttg gtagattctt ggatttcatg aaggaaacac atgtccatta. tgaacaaggt 420 

acatttattg ctatcaagcg caactttg^a accatttggg atttgattcg tcttcagtat 480 

gtgcctgaaa tctttcgctt gcacttgttt ggtaagatct . atgacdgagc cagtaaatat 540 

ttccaaacca agaaaatgcg tatggctttt acttttcaaa caatgtatat gggtatgtcg -600 

ccttatgatg ctccagcagt ttacagtttg ttacaataca ccga'gtttgc tgaaggtatc 660 

tggtatcctc gtggtggttt caacatggtt gttcagaagc ttgagtctat cgcctccaaa 720 

jgtacggtg ctgaattcag atatcaatcg cctgttgcta aaattaacac tgtcgataaa 780 

gacaagcgtg taaccggtgt cactttggaa agcggagaag tcattgaagc cgatgcagtc 840 

gtatgtaatg cggatcttgt ttatgcttat caccatctgt ta'cctccttg caattggaca 900 

aagaagacat . tagcctcaaa gaaactcact tcatcatcta ' tttcgtttta ttggtccatg 960 

tcaacaaagg tgcctcaatt agacgtacac aatatcttct tggctgaagc ctacaaggaa 1020 

agttttgatg agattttcaa cgacttcggt ttgccctctg aagcttcatt ctatgtoaac . 1080 

gttccatctc gaattgatga. atctgccgca cctcccaaca aggactccat tattgtgttg 1140 

tccaattg gccatatgaa gagtaagaca ggaaacagtg ctgaagaaaa tta.tcctgag 1200 

ttggtaaacc gtgcacgcaa gatggttctg gaagttatcg aacgtcgttt gggagtaaac 1260 

aactttgcta atttgattga acatgaagaa gtgaatgatc ctagtgtttg gcaaagcaag 1320 

tttaaccttt ggagaggttc tattcttggt ctttct.catg atgtgttcca agttctctgg 1380 

ttcagaccta gtaccaagga ttccacaaac cgttatgata atcttttctt tgtcggagct 1440 

agtacacatc caggtactgg tgttccfcatc gttcttgctg gaagtaagct tacttccgac 1500 

caagtctgta aaagctttgg ccagaatccc ttaccaagaa agttacaaga tagccaaaag 1560 
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aagtatgctc ctgaacaaac tcgtaagacc gaaagccatt ^ggatctatta ttgtcttgct 1620 

tgttactttg ttactttcct ctttttctat ttcttcccaa gagatgatac tacaactcct 1680 

gcttctttca ttaaccaact tttacctaac gttttccaag tacaaagcag caacgatatt 1740 
cgcatttaa 



1749 




<210> 12 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
20> 

<223> Beschreibung der kunstlichen Sequenz : Primer 
<400> 12 

agagagggat ccttaaatgc gaatatcgtt gc 32 



<210> 13 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 




2.0> 

23> Beschreibung der kunstlichen Sequenz : Primer 



<400> 13 

agagagggat ccatgtctga tcaaaagaag ca , 32 



<210> 14 
<211> 37 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz : Primer 



BASF AG : . ; ; -28/8^ s ; ; <"" ; % ^September 2003 

BASF NAE 579/03 : _ — J " « ' - 



<400> 14 * 

actttattgg atccttaaat gcgaatatcg ttgctgc 37 





<210> 15 
<211> 38 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> * 

<223> Beschreibung der kttnstlichen Sequenz : Primer 
<400> 15 

tccaattg gccacatgaa gagtaagaca ggaaacag 38 



<210> 16 ( 
<211> 38 
<212> DNA 

<213> Kiinstliche Sequenz 

<220> . ' ' 

<223> Beschreibung der kiinstlichen Sequenz : Primer 

<400> 16 

cctgtcttac tcttcatgtg gccaattgga accaacac 38 



<210> 17 
<211> 38 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : Primer 
<400> 17 

ctattttaat catatgtctg atcaaaagaa ' gcatattg 38- 



<210> 18 
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<211> 1771 
<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS 

<222> (166) . . (1151) 




<223> 



<40Q> 18 

cacgagct. tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca . 60 

aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120 

ccgcgagtc.t cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 

* * Met Gin Leu Ala 

1 ■ 

gcg aca gta atg ttg gag cag ctt acc. gga age get gag gca etc aag 225 
Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu.Ala Leu Lys 
5 . 10 15 . 20 

gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 273 
u Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 
25 30 35 

gcg acc cag tac teg ctt ccg tea gaa gag tea gac gcg gee cgc ccg 321 
Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala ,Ala Arg Pro 
40 45 50 

gga ctg aag aat gee tac aag cca cca cct tec gac aca aag ggc ate 369 
Gly Leu Lys Asri Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly lie 
*5 . 60 65 

aca atg gcg eta cgt gtc ate ggc tec tgg gee gca gtg ttc etc cac 417 
Thr Met Ala Leu Arg Val lie Gly Ser Trp Ala Ala Val Phe Leu His 
70 75 80 
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gcc att ttt caa ate aag ctt. ccg acc tec ttg gac cag ctg cac tgg 465 
Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp Gin Leu. His Trp 
85 90 95 100 

ctg .ccc gtg tea gat gcc aca get cag ctg gtt age ggc acg age age 513 
Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser Gly Thr Ser Ser 
105 . 110 115 

ctg etc gac ate gtc gtagta ttc ttt gtc ctg gag ttc ctg tac aca 561 
Leu Leu Asp lie Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr 
120 125 130 

ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gcc atg 609 
y Leu Phe- lie Thr Thr His Asp Ala Met His Gly Thr He Ala Met 
135 ' 140 145 

aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 657 
Arg Asn Arg ; Gin Leu Asn Asp Phe Leu Gly Arg Val Cys lie Ser Leu 
150 - .155 160 

tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac , 70§ 

Tyr Ala Trp Phe Asp Tyr Asn Met Leu. His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ,ttc cac agg gga 753 
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
•185 190 * . 195 



aac cct ggc att gtg ccc tgg ttt gcc age ttc atg tec age tac atg 801 
Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

teg atg tgg cag ttt gcg cgc etc gca tgg tgg : acg gtg gtc atg cag 849 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met . Gin 
215 220 225' 

ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg 897 
Leu Leu Giy Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 235 240 




ccc ate ctg tec gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 



945 
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Pro. He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyx Met Pro 
245 250 . 255 ^ 260 

cac aag cct gag cct ggc gcc gcg tea ggc tct tea cca gec gtc atg 993 
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
265 270 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 1041 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu V«al Ser Phe 
280 .285 290 

ctg ace tgc tac cac ttc . gac ctg cac tgg gag cac cac cgc tgg ccc 1089 
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Ar-g Trp Pro 
295 300 305 

ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga 1137 
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 315 320 

ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 1185 

Gly Leu Val Pro Ala 

325 

gctgggcatg caggttgtgg. caggactggg tgaggtgaaa agetgeagge gctgctgccg 1245 

gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 1305 

agettge cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 1365 

acccttgcag gagatgtctt gegtegggag gagtgttggg cagtgtagat gctatgattg 1425 

tatcttaatg ctgaagcett taggggagcg acacttagtg ctgggcaggc aacgccctgc 1485 

aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 1545 

ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 1605 

agagctgegt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 1665 

agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt " ggtgcgctgc 1725 
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ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 1771 

<210> 19 

<211> 329 

<212> PRT 

<213> Haematococcus pluvialis 




00> 19 , 
;t Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
1 5 ' . 10 4 15 



Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val 
20 25 30 



Leu Arg Thr Trp Ala Thr Gin Tyr Ser, Leu- Pro Ser Glu Glu Ser Asp 

35 40 45 . ' 



^sj^ja Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 

50 . 55 . 60 




Thr Lys Gly lie Thr Met Ala Leu Arg Val lie Gly Ser Trp Ala Ala 
65 70' 75 80 



Val Phe Leu His Ala lie Phe Gin He Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 110 
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Gly.Thr Ser Ser Leu Leu Asp lie Val Val Val Phe Phe Val Leu Glu 

' 115 120 . i25 



Phe Leu Tyr Thr Gly Leu Phe He Thr Thr- His Asp Ala Met His Gly 
130 135 140 



Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 




s He Ser Leu Tyr Ala Trp Phe Asp Tyr* Asn Met Leu His Arg Lys 
* 165 170 175 . 




His Trp Glu His His Asn His Thr .Gly Glu Val Gly Lys Asp Pro Asp 
. 180 185 190 



Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 • 205 



Ser Ser Tyr Met Ser Met . Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 .215 220 



Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 240 



Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu Phe . Tyr Phe Gly 
245 • 250 . 255 • 



Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 . 265 ' 270 
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Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 

* * ♦ * 

Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 ' 295 • 300 

His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg . 
305 310 315 320 



•u Ser Gly Arg Gly Leu Val Pro Ala ■ 
325 

! 

• \ 

<210> 20 
<211> 1662 

<212> DNA ' 
<213> Haematococcus pluvialis 

<221> CDS 

<222> (168) (1130) 

<223> ' 

<400> 20 

cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60 
gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120 
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ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 176 

Met His Val 
1 

gca teg gca eta atg gtc gag cag aaa ggc acjt gag gca get get tee 224 
Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tec 272 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met .Pro Ser 
20 25 30 35 

jg teg tea gac gca get cgt cct gcg eta aag cac gee tac aaa cct 320 
u Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala T^r Lys Pro 
40 ' 45 ' 50 

cca gca tct gac gee aag ggc ate acg atg gcg ctg ace ate att ggc 368 
Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr He lie Gly 
55 ' « 60 65 

ace tgg acc gca gtg ttt tta cac - gca ata ttt caa ate agg eta ccg 416 
Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He Arg lieu Pro 
.70 75 80 

aca tec atg gac cag ctt cac tgg ttg cct gtg tcc'gaa gee aca gee 464 



Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 .95 



cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 512 

Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala Ala Val Phe 
100 105 110 115 

att gta ctt gag ttc ctg tac act ggt eta ttc ate acc aca cat gac 560 

He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp 
120 125 130 

gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 608 
Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu Asn Asp Leu 

135 140 145 
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ctt ggc aac ate tgc ata tea ctg tac gec tgg ttt gac tac age atg 656 
Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Tip Phe .Asp Tyr. Ser Met 
150 155 160 

ctg cat' cgc aag cac tgg gag cac cac aac cat act ggc gaa gtjg ggg 704 
Leu His Arg Lys His Trp Glu His His Asri His Thr Gly Glu Val Gly 
165 170 175 

aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 752 
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
180 ; 185 190 , 195 ' 

gec age ttc atg tec age tac atg tee ctg tgg cag ttt gee egg ctg 800 
p Ser Phe Met Ser Ser Tyr Met Ser Leu Tzp Gin ■ Phe Aia » Arg Leu 
200 205 210 

gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 848 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro Met . Ala Asn 

215 * 220 . 225 ' 

.etc -eta gtc ttc atg get gca gec cca ate ttg tea gca ttc cgc etc 896 
Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu 
230 235 240 

ttc tac ttc ggc act tac ctg cca cac aag cct. gag cca ggc cct gca 944 
Phe Tyr Phe Gly Thr Tyr Leu Pro His L^s Pro Glu Pro Gly Pro Ala 
245 250 255 



gca ggc tct cag gtg atg gee tgg ttc agg gec aag aca agt gag gca 992 

Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
260 265 . 270 . 275 

tct gat gtg atg agt ttc ctg aca tgc .tac cac ttt gac ctg cac tgg 1040 

Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 

280 285 290 

gag cac cac agg tgg ccc ttt gec ccc tgg tgg ca^ ctg ccc cac tgc 1088 

Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu Pro His Cys 

295 300 305 ' 

cgc cgc ctg tec ggg cgt ggc ctg gtg cct gec ttg gca tga 1130 
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Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
310 315 320 ' 

cctggtccct ccgctggtga cccagcgtct gcacaagagt ^ gtcatgctac agggtgctgc 1190 

ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 1250 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg. gggtctggca gtggctagga tggagtttga 1370 

, 1 i 

tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430 

^^^^cggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgcac 1490 

acagccaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tcgtgctatt 1550 

gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610 

gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662 

<210> 21. 

<211> 320. 

^12> PRT 

<213> Haematococcus pluvial is 

<400> 21 

Met His. Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
1 5 10 15 

Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His 
20 25 30 
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Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu 'Lys His Ala 
35 40 45 



Tyr Lys Pro Pro Ala Ser Asp 'Ala Lys Gly lie Thr Met Ala Leu Thr 
.50 55 60 



lie He Gly Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He 

65 70 75 . .80 




g Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
85 90 . 95 




Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser ' Leu Leu His He Ala 
100 105 110 



Ala Val Phe. He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe lie Thr 
. 115 120 125 



Thr His Asp Ala .Met His Gly Thr He Ala Leu Arg His Arg Gin Leu 
130 135 140 



Asn Asp Leu Leu Gly Asn He Cys lie Ser Leu Tyr Ala Trp Phe Asp 
145 150 155 160 



Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
* , 165 170 175 



Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Vai 
180 185 190 
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Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 



Ala Arg Leu Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro* 
210 215 220 



Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala 
225 ' 230 235 240 



Phe Arg , Leu. Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
■245 ' 250 ■ 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 

260 ' 265 270 ' 



Ser Glu Ala Ser Asp Val Met* Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280. 285 



Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
.290 295 300 




i 



ro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
305 . 310 . . 315 * 320 



<210> 22 

<211> 729 

<212> DNA 

<213> Agrobacterium aurantiacum 



BASFAG 

BASF NAE 579/03 
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<220> 

<221> CDS 

<222> (\1)..<729) 

<223> 




<400> 22 . . 

,g age gca cat gec ctg ccc aag gca gat ctg acc gec acc age' etg' 48 

t Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr 'Ser Leu 

1 5 10 -15 

\ 

ate gtc teg ggc ggc ate ate gee get tgg ctg gee ctg cajb gtg cat 96 
lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu. His Val His 
20 25 30 



gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala lie Ala 
35 40 -45 



144 




aat tie ctg ggg ctg acc tgg ctg teg. gtc gga ttg ttc atc ate gcg. 192 
n Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie lie Ala 
50 55 60 

cat gac gcg' atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gec aat '240 
His Asp Ala Met His Gly Ser Val . Val Pro Gly Arg Pro Arg Ala Asri 
65 70 '75 .80 



gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
.85 90 95 



288 



cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gec gga acc 
Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



336 
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gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tap gcc -384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val' Arg Trp .Tyr Ala 
115 120 125 

■cgc ttc ate ggc acc tat ttc ggc tgg cgc. gag ggg ctg ctg ctg ccc 432 
Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
13'0' 135 140* 





ctg acc tgc ttt cac ttt ggc ggt tat cat pac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyx His His Glu His His Leu His 
210 215 220 



480 



528 



gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 
Val lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 * 155 160 

gtg gtc ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 
1 Val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser lie Gin Leu Phe 
165' 170 175 

gtg ttc. ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 ' 185 190 

i 

gac cgc cac aat gcg egg teg. teg egg ate age gac ccc gtg teg ctg 624 
Asp Arg His Asn Ala. Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 



672 



720 



ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 
Pro Thr Val' Pro Trp Trp Arg Leu Pro Ser Thf Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<210> 23 
<211> 242 
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<212> PRT 

<213> Agrobacterium aurantiacum 




<400> 23 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
1 5 .10 15 



lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 '45 



Asn Phe Leu Gly Leu Thr. Trp Leu Ser Val Gly Leu Phe lie He Ala 
50 55 60 



His Asp Ala Met . His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 . 75 80 



a Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 



BASF AG ' 
BASF NAE 579/03 
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130 135. 140 



Val lie Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro. Leu Pro Ser lie . Leu Ala Ser lie Gin Leu Phe 
165 170 ' 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 

. 180 185 . ' • 190 



Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
t95 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His GlU His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg. Thr Lys Gly Asp 
225 230* . 235 240 



Ala* 



<210> 24 

<211> 1631 

<212> DNA 

<213> Alcaligenes sp. 
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<220> 
<221> CDS 
<222> (99).. (827) 
<223> 




<400> 24 

ctgcaggccg ggcccggtgg. ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 

1 ' 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg acc gee* gcg ate 164 
Gly Thr Thr Gly Asp Thr lie Val Asn Leu Gly Leu Thr Ala Ala -lie 
10 15 20 



ctg ctg tgc tgg ctg gtc ctg cac .gcc ttt acg eta tgg ttg eta gat 212 
' Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp ■ 

4 * 

25 30 35 . 



g gcc gcg cat ccg ctg ctt gcc gtg ctg tgc ctg get ggg ctg acc 260 



Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu ( Ala Gly Leu Thr 
40 45 50 



tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu Ser Val Gly Leu Phe lie lie Ala His ,Asp Ala Met His Gly 
55 60 65 ; 70 

tec gtg gtg ccg ggg egg ccg cgc gcc aat gcg gcg ate ggg caa ctg 356 
Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala He Gly Gin Leu 
75 80 85 

gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gcc aag 404 
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu He Ala' Lys 
•90 95 100 



\ 
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cac atg acg cat cac egg cac gec ggc -acc gac aac gat ccc gat ttc 452 
His Met Thr His His Arg His- Ala Gly Thr AspAsn Asp Pro Asp Phe 
105 110 115 

ggt cac gga ggg ccc gtg cgc tgg tac ggc. age ttc gtc tec acc tat 500 
Gly His Gly Giy Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

ttc ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc acq acc tat 548 
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val lie Val Thr Thr Tyr 
135 140 145 150 



£g ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 
Ala Leu lie Leu Gly Asp Arg Trp. Met Tyr. Val lie Phe Trp Pro Val 
155 .160 165 

ccg gee gtt ctg gcg teg ate cag att ttc gtc ttc gga act tgg ctg 
Pro Ala Val Leu Ala Ser lie Gin lie Phe Val Phe Gly Thr Trp Leu 
.170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg 
185 190 195 

eg acc ggc ate ggc gac ccg ttg tea eta ctg acc tgc ttc cat ttc 740 
r Thr Gly He Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 'i 210 

ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg . 788 
Gly Gly Tyr His His Glu His His Leu His Pro His Val .Pro. Trp Trp 
215 220 225 * 230 




644 



692 



cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 837 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala 
235 240 

cattgtcgtg gcgacagtcc "tcgtgatgga gctgaccgcc tattccgtcc acegctggat 897 



V 

tatgeaegge cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 957 



tC'f. ft ,:«.• 
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gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017 

cgtgggcgcc tattggtggc. cggtgctgtg gtggatcgcc ctgggcatga cggtctatgg 1077 

gttgatctat ttcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137 

tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgectgcacc . acgcggtcga . 1197 

ggggcgggac cactgcgtca gcttcggctt cabctatgcc ccacccgtgg acaagctgaa 1257 

gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct . 1317 

^^^^tcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377 

gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct ' tcgcgtgctg ctgctggacc 1437 

i 

gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497 

i 

. actggctgga ccgcctgaag ccgatcaggc gtggcgactg . gcccgatcag gaggtgcggt 1S57 

tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga 1617 

tgcgtgcggt gacc 1631 

i ■ . 

^m^io> 25 

^^^211> 242 * 

<212> PRT ' • . 
<213> Alcaligenes sp. 

* 

( 

<400> 25 

Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr lie Val Asri Leu 
1 5 10 15 
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Gly Leu Thr. Ala Ala lie Leu Leu Cys Trp Leu Val Leu His Ala Phe 
' 20 25 • 30 

Tlir Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 

. 35 .40 ' .45 • 

* . • 

Cys Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie lie Ala 

50 55 60 

•s Asp Ala Met His Gly Ser; Val Val Pro Gly Arg Pro Arg Ala Asn . 
70 75 80 



Ala Ala lie Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Pro Lys Leu lie Ala Lys His Met Thr His His Arg His Ala Gly .Thr 
100 105 110 

. Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 
115 120 125 

Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 

130 135 .140 

* 

Val lie Val Thr Thr Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 i50 155 160 



Val lie Phe Trp Pro Val Pro . Ala Val Leu Ala Ser He Gin He Phe 
165 170 175 
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Val Phe Gly Thr. Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
• 180 * 185 190 

* « 

Asp Arg His Asn Ala Arg.Ser Thr Gly lie Gly Asp Pro Leu Ser Leu 
195 200 . 205. 

Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 

230 .-• 235 240 

Arg Ala 
<210> 26 

! 

<211> 729 . 
<212> DNA 
~13>- Paracoccus marcusii 

<220> 

<221> CDS 
<222> (1). .(729) 
<223> 

<400> 26 
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cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg. ctg ctg ccc 
Arg Plie He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 
Val He Val Thr Val Tyr Ala Leu lie Leu Gly Asp Arg Trp Met Tyr 
145 150 ' 155 160 



48 



atg age gca cat gee ctg ccc aag gca gat ctg acc gec aca agc^ctg 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
1 . 5 10 15 

ate gtc teg ggc ggc ate ate gee gca tgg ctg gec ctg cat gtg cat 96 
He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
.20 25 30 

gcg ctg tgg ttt ctg gac gcg gcg gee cat ccc ate ctg gcg gtc gcg 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala . 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg. .192 
n Phe Leu .Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50, 55 60 

cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 . 7Q 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 
Ala Ala Met ...Gly Gin Leu Val Leii Trp Leii Tyr Ala Gly Phe Ser Trp 
85 90 * .95 

cgc aag atg ate gtc aag cac atg gec cat i cac cgc cat gee gga acc 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 ' 105 . 110 

5ac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg; tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 5 120 125 



288 



336 



432 



480 



gtg gtc ttc tgg ccg ttg ccg teg ate ctg, gcg teg ate cag ctg ttc 



52 
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Val Val Phe Trp Pro Leu. Pro- Ser He Leu Ala Ser He Glri Leu Phe 
165 170 . i75 

i 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe. Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
\ 180 185 190 

gac cgc cataat gcg egg teg teg egg ate age gac cct gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp . Pro Val Ser Leu 
195 200 205 

ctg ace tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 

210 215 220 

t 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc ace aag ggg gac . 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 * 230 235 ' 240' 

acc gca tga 729 
Thr Ala 




<210> 27 

211> 242 

) ' 

?212> PRT 

<213> Paracoccus marcusii 



<400> 27 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
1 5 10 . 15 

lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 - 
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Ala Leu Trp Phe Leu Asp . Ala Ala Ala His Pro lie Leu Ala Val Ala 
35 . 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 




a Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met lie Val Lys His Met Ala His His Arg .His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp. Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 ." 125 




g Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly .Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu lie Leu. Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser lie Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 
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Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val * Ser Leu 
195 200 - 205 

Leu Thr Cys Phe His Phe Gly Gly Tyr- His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 -230. 235 . * 240 

<210> 28 ' 

<211> 1629 

<212> DNA 

<213> Synechococcus sp. 




<221> CDS 

<222> (1) . . (1629) - 

<223> 

<400> 28 

atg ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta 
Met He Thr Thr. Asp Val Val. He He Gly Ala Gly His Asn Gly Leu 
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1 5 10 * 15 

gtc tgt gca gcc tat ttg. etc caa egg ggc ttg ggg gtg acg tta eta ' 96 

Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 . 

gaa aag egg. gaa gta cca ggg ggg gcg gcc acc aca gaa get etc atg 144 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thx Thr Glu Ala Leu Met 
35 40 45 

ccg gag eta tec e'ec cag ttt cgc ttt aac cgc tgt gcc att gac cac 192 
Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala lie Asp His. 
50 55 60 



ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta. gcc cag 240 
Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
.65 < • 70 75 80 

tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg. 288 
Tyr Gly Leu . Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



ctg gat ggc caa get ttt atg age tag cgt tec eta gaa aaa acc tgt 336 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 ' • 110 



pc cac att gcc acc tat age ccc cga gat gcg gaa aaa tat egg caa 384 
His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



ttt gtc aat tat tgg acg gat ttg etc aac get gtc cag cct get ttt. 432 
Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 • 135 140 

aat get ccg ccc cag get tta eta gat tta gcc ctg aac tat ggt tgg 480 
Asn Ala Pro Pro Gin .Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 4 150 155 160 ' 



gaa aac tta aaa tec gtg ctg gcg ate gcc ggg teg aaa acc aag gcg 
Glu Asn Leu Lys Ser Val Leu Ala lie Ala Gly Ser' Lys Thr Lys Ala 
165 170 175 



528 
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ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 576 
lieu Asp Phe lie Arg Thr Met lie Gly Ser Pro Glu Asp Val Leu Asn 
180 .185 190 

gaa tgg ttc gac aa;c gaa egg gtt aaa get cct tta get aga eta tgt 624 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 . 200 . 205 

i 

teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 672 

Ser Glu lie Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 

210 215 • 220 

jg atg gtg gee atg egg cat ttg gag gga att gee aga cca aaa gga 720 
t Met Val Ala Met Arg His Leu Glu Gly lie Ala Arg Pro Lys Gly 
225 23Q 235 . 240 

ggc act gga gee etc aca gaa gec ttg gtg aag tta gtg caa gee caa 768 
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 

245 - -250 255 

i ■ * 

ggg gga aaa ate etc act gac caa ace gtc aaa egg gta ttg gtg gaa 816 
Gly Gly Lys lie Leu Thr Asp Gin Thr Val hys Arg Val Leu Val Glu 
260 . 265 • < 270 

• • • 

aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag tac egg 864 
:n Asn Gin Ala lie Gly Val Glu Val Ala Asn Gly* Glu Gin Tyr Arg 
275 280 285 

gee aaa aaa ggc gtg att .tct aac ate gat gee cgc cgt tta ttt ttg 912 
Ala Lys Lys Gly Val lie Ser Asn lie Asp Ala Arg Arg Leu Phe Leu 
290 . 295 300 

caa ttg gtg gaa ccg ggg gec eta gee aag gtg aat caa aac eta ggg . 960 
Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 v 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gee att tta aaa 1008 
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala lie Leu Lys 
325 330 335 
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ate gat tgt gec etc tec ggt tta ccc cac ttc act gee atg gee ggg 1056 
He Asp Cys Ala Leu Ser Gly Leu .Pro His Phe Thr Ala Met Ala Gly 
• .340 345 , 350 

ccg gag gat eta acg gga act att ttg att gec gac teg gta cgc cat 1104 
Pro Glu Asp Leu Thr Gly Thr lie Leu lie Ala Asp Ser Val Arg His 

355 ... 360 : . 365 

i 

gtc gag gaa gee cac gee etc att gec ttg ggg caa att ccc gat gc£ 1152 
Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 . 375 _ 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc ac,c atg 1200 
,n Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
5 390 * 395 400 

gec' ccc cct ggg cag cac acc etc tgg ate gaa ttt ttt gee ccc tac 1248 
Ala Pro Pro Gly Gin Sis Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

cgc ate gec ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 
Arg He Ala Gly Leu Glu. Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat aaa tta acg. - 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp. Lys Leu Thr 
435 -440 445 



gac tat gec <:ct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 1392 
Asp Tyr Ala Pro Asn Leu Lys Ser Leu He lie Gly Arg Arg Val Glu 
450 455 460 

agt ccc gee gaa. ctg gee caa egg 'ctg gga agt tac aac ggc aat gtc 1440 
Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 

t 

tat cat ctg gat atg agt ttg gac- caa atg atg ttc etc egg cct eta 1488 
Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 , 495 




ccg gaa att gee aac tac caa acc ccc ate aaa aat ctt tac tta aca 



1536 
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Pro Glu lie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr . 
500 505 510 



ggg 9 C & g&t acc cat ccc sst ^gc tcc ata tca ggt a ^ g ccc ggfc aga 
Gly Ala Gly Thr His . Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 

aat tgc get egg "gtc ttt tta - aaa caa caa cgt cgt ttt .tggtaa 
Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 29 

11> . 542 
<212> PRT 

<213> Synechococcus sp. 





<400> 29 . - 

Met He Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
! 5 10 15 



Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 



Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 .45 



Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 . 55 • 60 



1584 



1629 



Glu Phe He Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 



BASF AG 

BASF NAE 579/03 

65 
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. * t f 



70 



75 



80 



Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 , 125 



Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
' .130 -135 140 



Asn Ala Pro Pro Gin Ala Leu. Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 




Glu Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 



165 



170 



175 



Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185. 190 



Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



Ser Glu He Gly Ala Pro Pro, Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 



Met Met Val Ala Met Arg His Leu Glu Gly lie Ala Arg Pro Lys Gly 
225 230 235 240 
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Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys. Leu Val Gin Ala Gin 
245 250 255 



Gly Gly Lys lie Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 ' 265- 270 . 

. Asn Asn Gin Ala lie Gly Val* Glu Val Ala Asn Gly Glu Gin TyrArg 
275 ' 280 285 

^j^a Lys Lys Gly Val lie Ser Asn lie Asp Ala Arg Arg Leu Phe Leu 

290 295 300 

■ 

Gin Leu' Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 s 

Glu Arg Leu. Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



•e Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
I 340 345 350 

Pro Glu Asp Leu Thr Gly Thr lie Leu He Ala Asp Ser Val Arg His 
355 360 . 365 



Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin lie Pro Asp Ala 
370 375 380 



Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
385 390 i 39^5 ,400 



BASF AG 
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Ala Pro Pro Gly Gin His Thr Leu Trp lie Glu Phe Phe Ala Pro Tyr 
405 410 415 



Arg lie Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 



Asp Glu Leu Lys Glu Lys Val. Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 




p Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 




Ser Pro Ala Glu. Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 , 470 475 480 



Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 



Pro- Glu He Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 



Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 



Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 30 



<211> 776 
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•<212> DNA . 

<213> Bradyrhizobium sp. .... ' 




<220> 

<221> CDS 

<222> (1)..(774) 



<223> 



<400> 30 " 

atg cat gca gca acc gcc aag get act gag ttc ggg gec t.ct egg cgc 48 

Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly. Ala Ser Arg Arg . 
1 5 10 15 

gac gat gcg agg cag cgc cgc gtc ggt etc acg ctg gcc gcg' gtc ate 96 

Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 

20 25 30 



c .gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg jttc ttc tgg ccg 144 
Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 . 40 45 



ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag . 192 

Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 

acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 240 
Thr Trp Leu Tyr Val Gly Leu Phe lie lie Ala His Asp Cys Met His 
65 70 75 80 

ggc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 288 
Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg lie Gly Gin 
85 90 95 
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etc tgc ctg ttc etc tat gec ggg ttc tec ttc gac get etc .aat gtc 336' 
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 

gag cac cac aag cat cac- cgc cat ccc ggc acg gee gag gat ccc gat 384 
Glu His His Lys His His Airg His Pro Gly Thr Ala 6lu Asp Pro Asp 
■ 115 120 125 

ttc gac gag gtg ccg ccg cac ggc ttc. tgg cac tgg ttc gee age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp- Phe Ala Ser Phe* 
130 : 135 . 140 

c ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gee gtc 480 

Phe Leu His Tyr Phe. .Gly Trp Lys Gin Val Ala lie lie Ala Ala Val 
145 150 155 160 

teg ctg gtt tat cag etc gtc ttc gee gtt ccc ttg cag aac ate ctg 528 
Ser Leu Val Tyr Gin Leu Val Phe Ala. Val Pro Leu Gin Asn lie Leu 
165 . 170 . 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc ace 576 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu PheiThr 
180 ' - ' 185 " .. . 190 

c ggc ace tat ctg ccg cac aag ccg gee acg cag ccc ttc gee gat .624 
e Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin , Pro Phe Ala Asp ■ 
195 200 205 

cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg % . ctg ctg 672 
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp' Leu Ser Leu Leu 
210 215 220 

acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 720 
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 . 230 235 240 




gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gee ctg gaa agg 
Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



768 
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cgt gac ta 776 
Arg Asp 



<210> 31 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 




<400> 31 

V 

Met His Ala Ala Thr Ala Iiys Ala Thr Glu Phe Gly Ala' Ser Arg Arg 
X 5 10 15 



Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val lie 
20 • 25 30 



lie Ala Ala Trp Leu Val Leu His Val Gly .Leu Met Phe Phe Trp Pro 

35 .40 '45 



Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 . 55 60 



Thr Trp Leu Tyr Val Gly Leu Phe lie lie Ala His Asp Cys Met His 
65 70 75 80 




Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg lie Gly Gin 
85 90 95 
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Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 . iio 



Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 .120 125 



Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 . 140 



Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala lie lie Ala Ala Val 

150 . * 155 160 



Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn lie Leu 
165 170' 175 



Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 ' 185 190 



Phe Gly . Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp. Leu Ser Leu Leu 
210 215 220*. 

i 

Thr Cys Phe His Phe Gly Phe His His Glu His : His Leu His Pro Asp 
225 . 230 235 240 




Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 
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Arg Asp 



<210> 32 

<211> 777 

<212> DNA 

<213> Nostoc sp. 




20> 



<221> CDS 

<222> (1)..(777) 

<223> . 




<400> 32 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg\ gtg tta 

t Val Gin Cys Gin Pro Ser Ser Ley His Ser Glu Lys Leu Val Leu 
5 10 15 

ttg tea teg aca ate aga gat gat aaa aat att aat aag ggt ata ttt 
Leu Ser Ser Thr lie Arg Asp Asp Lys Asn lie Asn Lys Gly lie Phe 
20 25 30 

att gec tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 
He Ala Cys Phe lie Leu Phe Leu Trp Ala lie Ser Leu lie Leu Leu 
35 40 45 

etc tea ata gat aca tec ata att cat aag age tta tta ggt ata gee 
Leu Ser lie Asp Thr Ser lie lie His Lys Ser Leu Leu Gly He Ala 
50 55 60 



48 



96 



144 



192 
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ajtg ctt tgg cag acc ttc tta tat aca ggt tta ttt att act get cat 240 
Met- Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His t 
65 ' 70 75 ' . * 80 

gat gec atg cap ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 288 
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
85 -90 ' 95 

i • it,, 

ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 336 
Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



at tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 384' 
Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 ' , 125 




tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 432 
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe. Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480 
Tyr Leu His Phe Met. Lys Ser Tyr Trp Arg Trp Thr Gin lie Phe Gly . 
145 150 155. 160' 

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528 
Leu Val Met He Phe His Gly Leu Lys Ash Leu Val His He Pro GlU 
165 . 170 175 . , 

aat aat tta att .ata ttt tgg > atg ata cct tct att tta agt tea gta 576 
Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 

caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 624 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 -205 

ggt tat act aac ccc cat tgt gcg cgc agt ate cca' tta cct ctt ttt ' 672 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro* Leu Pro Leu Phe 
210 ' 215 . 220 

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac .720 
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Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 . 235 240 

gaa* tac cct.caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 768 
Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
245 250 255 . 

tct tta taa 
Ser Leu 



777 

i 




<210> 33 



r 211> 258 



<212> PRT 



<213> Nostoc sp. 



<400> 33 v 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
1 . 5 .10 .15 



Leu Ser Ser Thr lie Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 , • 25 30 




He Ala Cys Phe lie Leu Phe Leu Trp Ala He Ser Leu He. Leu Leu 
35 40 45 



Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 



Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
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65 70 75 80 



I 

Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg lie Asn Asn 
85 90 .95 



Phe lie Gly Lys Leu Thr Leu lie Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 ' 110 



Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 lip , 125 



Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe' Leu Trp 
130 135 140 




'Tyr' Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 



Leu Val 'Met, He Phe .His. Gly Leu Lys Asn Leu Val His He Pro. Glu 
165 170 . 175 



♦ 



Asn Leu He lie Phe Trp Met He Pro Ser lie Leu Ser . Ser Val 
180 185 - 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 



Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 



Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 
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Glu Tyr Pro Gin Leu Pro Trp' Trp Lys Leu Pro Glu Ala His Lys lie 
245 250 255 



Ser Leu 




<210> 34 



<211> 789 



12 > DNA 



<213> Nostoc punctiforme 




<220> 



<221> CDS 



<222> (1) . . (789) 



22 3 > 



<400> 34 

ttg aat ttt tgt gat aaa cca gtt age tat tat gtt gca ata gag caa 48 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin' 

1 5 10 15 

tta agt get aaa *gaa gat act gtt tgg ggg ctg gtg att gtc ata gta . 96 

Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val lie Val He Val 
20 25 30 



att att agt ctt. tgg gta get agt ttg get ttt tta eta get att aat 144 
He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala lie Asn 
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35 40 45 



tat gee aaa gtc* cca att tgg ttg ata cct att . gca ata gtt tgg caa 192 
Tyr Ala Lys Val Pro lie Trp Leu He Pro He Ala lie Val Trp 'Gln 

50 55 60 • 

atg ttc ctt tat. aca ggg eta ttt att act gca cat gat get atg .cat .240 
Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 

» . - - 

ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate ggt tea 288 
Gly Ser Val Tyr Arg Lys Asn Pro Lys lie Asn Asn Phe He Gly Ser 
85 90 95 



a get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 336 
Leu Ala . Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met. Leu Lys 
• 100 105 110, 

aat cat tgc tta cat cab cgt cat cct get . age gaa gtt gac cca gat 384 
Asn His Cys Leu His His. Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 432 
Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His. Phe 
130 135 140 




m 



g ata gaa tac. tec agt tgg caa cag tta . ata gta eta act rate eta 480 
He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 * 155 160 



ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 528 

Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 

165. 170 175 

tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 57 6 

Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 

180 185 190 

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624 

Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr. Val Tyr 

195 200 205. 
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ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 672 
Pro His Cys Ser Gin Thr. He Lys Leu Bro Thr Phe Leu Ser Phe He 
210 215 220 

get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720 
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 • 230. 235 1 240 

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta' ttc aac 768 
Val Pro Trp Trp, Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
'245 250 255 



t tea .gta ace aat teg taa 78.9 
n Ser Val Thr Asn Ser 

260 • 



<210> .35 

i 

<211> 262 
<212> PRT 



<213> Nostoc puncti tonne 




<400> 35 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin 
1 5 10 15 



Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val lie Val He Val 
20 25 .30 

He He Ser Leu Trp Val Ala Ser Leu Ala Phe. Leu Leu \Ala He Asn 
35 40 45 
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Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala lie Val Trp Gin 
50 . 55 60 



Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 - 70 75 . 80 



Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Qly Ser 

85 '90 95 i . 



eu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 



Asn His Cys' Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
.115 120 125 



Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe' 
. 130 135 .14CT- 




Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 . 150 ' 155 160 



Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 



Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe lie 
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210 215 220 

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
.225 230 235 240 

Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg. Val Phe Asn 
245 ■ 250 255 

Asn Ser Val Thr Asn Ser 
260 

<210> 36 . 
<211> 762 
<212> DNA «' 
<213>' Nostoc punctiforme 

<220> 
I Rl>. CDS 

<222> (1) . . (762) . 
<223> 



<400> 36 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 

Val lie Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
1.5 10 15 

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 
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Val Leu Arg Ser Lys* Ser Gin Phe Lys Gly Leu Phe lie Ala He Val 
20 25 30 

att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 144 
He Val Ser, Ala Trp Val He Ser Leu Ser Leu Leu. Leu Ser .Leu Asp 
35 . 40 45 

ate tea- aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 192 
He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val lie Leu Trp Gin 
. 50 , 55 '60 



aca ttt tta tat acg gga tta ttt att aca tct cat gat gee atg cat; 240 
Phe Leu Tyr Thr Gly Leu. Phe He Thr Ser His Asp Ala Met His 
« " 70 75 . 80 




ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 288 
Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu lie Gly Thr 
85 ' 90 95 

ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 336 
Leu Thr Leu Ser Leu Tyx Gly Leu Leu Pro. Tyr Gin Lys Leu Leu Lys 
100 105 110 

aaa cat tgg; tta cac cac cac.aat cca gca age tea ata gac ccg gat 384 
Lys His Trp Leu His ' His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 ( 

t cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 432 
Phe His Asn Gly Lys His* Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 ' 140 

atg aaa ggt tac tgg agt tgg ggg caa ata att g'cg ttg act' att att 480 
Met Lys Gly Tyr Trp Ser Trp Gly Gin He lie Ala Leu Thr He He 
145 150 155 160 

tat aac ttt get aaa tac ata etc cat ate cca agt gat aat eta act 528 
Tyr Asn Phe Ala Lys Tyr He Leu His. He Pro Ser Asp Asn Leu Thr 
165 170 175 

tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc. tat 576 
Tyr Phe Trp. Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
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180 185 19.0 

ttt ggt act. ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624 
Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 -2.05 

cct cat tgt gcc caa aca att age egt 'ect att tgg tgg tea ttt ate 672 
Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp- Trp Ser Phe He 
210 • • 215. 220 

acg tgc tat cat ttt cfgc tac cac gag gaa cat cac gaa tat cct cat 720 
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Prp His 
5 230 ' 235 240 



^£25 



t tct tgg tgg cag t.ta cca gaa att tac aaa gca aaa tag 762 
He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245» 250 



<210> 37 
<211> 253 



<212> PRT 



<213> Nostoc punctiforme 




<400> 37 * 

Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
1 5 10 15 * 



Val Leu Arg" Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 
20 25 30 



He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 
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He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 



Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 • 75 .80 

Gly Val Val Phe. Pro Gin Asn Thr Lys ,Ile Asn 'His Leu He Gly Thr 
85 90 .95 

100 105 i 110 

Lys His . Trp Leu His His His Asn Pro Ala. Ser Ser He Asp Pro Asp 
115 120 125 



Phe His Asn Gly Lys His Gin Ser Phe Phe Ala. Trp Tyr Phe His Phe. . 
130 ' 135 140 

• Lys Gly Tyr Trp Ser Trp Gly Gin He lie Ala Leu' Thr lie He 
150 155 160 

Tyr Asn Phe Ala Lys Tyr He Leu His - He Pro J3er Asp Asn Leu Thr 
165 170 175 



Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin. Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 
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Pro His Cys Ala Gin Thr lie Ser Arg Pro lie Trp Trp Ser Phe lie 
210 215 '220 



Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
.225 ' 230 , 235 . 240 



lie Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 




<210> 38 

<211> 1608 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 




> CDS 



<222> (3).. (971) 



<223> 



<400> 38 

ct aca ttt cac aag ccc, gtg age ggt gca age get ctg ccc cac ate 47 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He 
15 10 15 

ggc cca cct cct cat etc cat egg tea ttt get get ace acg atg ctg 95 
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Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu 
20 . 25 30 



teg aag ctg cag tea ate age gtc aag gee cgc cgc gtt gaacta gee 
Ser Lys Leu Glh Ser lie Ser Val Lys Ala Arg Arg Vai Glu Leu Ala 
35 40 45 



143 



cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 
Arg Asp He Thr Arg Pro Lys. Veil Cys Leu His? Ala Gin Arg Cys Ser 
50 55 60 



191 



tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 
ru Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 
65 70 75 



acc gtg cag get gee ggc gcg ggc gat gag cac age gee gat gta gca 
Thr Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 ' 85 90 95 



239 



287 



etc cag cag ctt gac egg get ate gca gag cgt cgt gee egg cgc aaa 
Leu Gin Gin Leu Asp Arg Ala He Ala Glu Arg Arg Ala. Arg Arg Lys 
100 105 110 



335 



egg gag cag ctg tea tac cag get gee gec att gca gca tea att ggc 
Arg Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser He Gly 
, 115 120 125 




tea ggc att gee ate ttc gee acc tac ctg aga ttt gee atg cac 
Val Ser Gly lie Ala' lie Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 135 140 



383 



431 



atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 
Met. Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 150 155 



479 



etc ttg gtg* gtt ggt ggc gcg etc ggc atg gag atg tat gee cgc tat 
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 * ' 165 170 175 



527 



gca cac aaa gee ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 



575 
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aag age cac cac aca cct cgc act ( gga ccc ttt gaa gec aac gac ttg 623 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

ttt gca ate ate aat gga ctg ccc gec .atg etc ctg tgt acc ttt ggc 671 
Phe Ala lie. He Asn Giy Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 ■ 2i5 220 

ttc tgg ctg ccc aac gtc ctg ggg .gcg gec tgc ttt gga gcg ggg ctg 719 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 " 



c ate. acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 767 
Gly He Thr Leu Tyr Gly Met Ala Tyr. Met. Phe Val His Asp Gly Leu 
240 245 250 . 2.55 

gtg cac agg cgc ttt ccc acc ggg ccc ate get ggc ctg ccc tac atg 815 
Val His Arg Arg Phe Pro Thr Gly Pro He Ala. Gly Leu Pro Tyr Met 

260 . 265 ' ' . 270 ' 

aag cgc ctg aca gtg gec cac cag eta cac cac age ggc' aag . tac ggt 863 
Lys Arg Leu Thr Val Ala His Gin. Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

gcg ccc tgg ggt atg ttc ttg. ggt cca cag gag ctg cag cac att 911 
Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He 
290 295 . 300 

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg . 959 
Pro Gly Ala Ala Glu Glu Val Glu . Arg Leu Val Leu Glu Leu Asp Trp 
305 310 . 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tggctagagc gatgcgtgtg agaegggtat gtcaeggteg actggtctga 1071 




tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 
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cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 
caggctggcg ttgaatdagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 

catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta 1311 
gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg 1371 

cafcgatgtae tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431 

i 

^^gacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 

^^rectcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 

tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608 

*« - 

<210> 39 
% <211> 322 
<212> PRT 

.» 

<213> Haematococcus pluvialis 




<400> 39 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala- Leu. Pro His lie Gly 
1 • 5 10 15' 

Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 
20 25 30 

: 

Lys Leu Gin Ser lie Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg 
' • 35 40. 45 
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Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 
50 .55 60 

" Val Arg Leu Arg Val- Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65. 70 75 .80 

t 

Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85 90 95 

100 105 110 

Glu Gin Leu Ser Tyr Gin " Ala Ala Ala He Ala Ala Ser lie Gly Val 

,115 • '■ 120 '• 125 

f ■ 

* 

Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 

^^■k Val Gly Gly Ala Val .Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
I I 150 155 160 

Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala 
165 170 175 



His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 " 1 2Q0 * 205 
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Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe 
210 215 220 

' Trp Leu Pro Asn Val Leu Gly Ala Ala Qys Phe Gly Ala Gly Leu Gly 

225 ' 230 235 *' .240 



He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
245 250 255 

• Arg Arg Phe .Pro Thr' Gly Pro He Ala Gly Leu Pro Tyr Met Lys 
260 265 270. 



Arg Leu Thr Val Ala His Gin Leu His -His Ser Gly Lys Tyr Gly Gly 
275 280 285 

Ala Pro tfrp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He Pro 
290 295 .300 



Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 

310 ' 315 320 



Lys Arg 



